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Introduction to the Theory of Computation Third Edition 


本 书 由 计算 理论 领域 的 知名 权威 Michael Sipser 所 撰写 。 他 以 独特 的 视角 ， 系 统 地 介绍 了 计算 理论 的 三 
个 主要 内 容 : 自动 机 与 语言 、 可 计算 性 理论 和 计算 复杂 性 理论 。 绝 大 部 分 内 容 是 基本 的 ， 同 时 对 可 计算 性 
和 计算 复杂 性 理论 中 的 某 些 高 级 内 容 进 行 了 重点 介绍 。 作 者 以 清新 的 笔触 、 生 动 的 语言 给 出 了 宽泛 的 数学 
原理 ， 而 没有 拘泥 于 某 些 低层 次 的 细节 。 在 证 明之 前 ， 均 有 “证 明 思 路 ”， 帮 助 读者 理解 数学 形式 下 强 尊 
的 概念 。 同 样 ， 对 于 算法 描述 ， 均 以 直观 的 文字 而 非 伪 代码 给 出 ， 从 而 将 注意 力 集中 于 算法 本 身 ， 而 不 是 
某 些 模型 。 新 版 根据 多 年 来 使 用 本 书 的 教师 和 学 生 的 建议 进行 了 改进 ， 并 用 一 节 的 篇 幅 对 确定 型 上 下 文 无 
关 语 言 进行 了 直观 而 不 失 严谨 的 介绍 。 此 外 ， 对 练习 和 问题 进行 了 全 面 更 新 ， 每 章 末 均 有 习题 选 答 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 芋 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信 息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 演 和 发 展 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华 草 公 司 较 早 意识 到 “出 版 要 为 教育 服务 "。 上 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 , 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
两 白 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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计算 机 改变 并 持续 改变 着 世界 ， 如 今 ， 计 算 技 术 已 把 人 们 带 进 了 云 〈 云 计算 )、 物 〈 物 
联网 ) 、 人 “〈 社 会 计算 )、 海 〈 海 量 数 据 、 大 数据 ) 的 新 时 代 。 

在 变革 的 时 代 里 ， 计 算 机 系统 也 改变 着 自己 ， 在 进步 和 进化 中 遵循 了 一 组 潜 规 则 一 一 
计算 理论 ， 这 套 理论 描述 和 论证 了 计算 机 的 能 与 不 能 ， 界 定 了 计算 能 力 的 极限 。 

业内 人 士 常 评说 某 人 为 某 问题 设计 了 一 个 比较 快 的 算法 ， 好 到 什么 程度 ? 用 专业 术语 
描述 ， 线 性 时 间 内 能 完成 的 比较 快 ， 多 项 式 时 间 能 完成 的 次 之 ， 不 能 在 多 项 式 时 间 内 完成 
的 就 是 不 现实 的 。 但 是 ， 大 数据 时 代 的 来 临 修正 了 这 一 观念 ， 对 于 大 数据 问题 ， 线 性 时 间 
也 嫌 太 长 ， 因 为 需要 “等 它 一 千年 " ”人们 呼唤 亚 线 性 、 亚 亚 线性 的 算法 。 

有 些 问 题 ， 人 们 已 经 找到 快 的 算法 ; 有 些 问 题 ， 还 没有 找到 快 的 算法 ， 也 许 是 等 一 个 
聪明 程序 员 的 出 现 。 但 有 一 类 问题 ， 没 有 找到 好 算法 不 是 因为 人 们 不 够 聪明 ， 而 是 根本 就 
不 存在 这 样 的 算法 。 

计算 理论 将 描述 算法 的 本 质 ， 揭 示 计 算 机 算法 的 能 与 不 能 、 快 与 慢 以 及 足够 快 的 近似 
技巧 。 从 这 个 角度 来 看 ， 计 算 理 论 是 计算 机 的 灵 殊 ， 是 应 用 计算 机 成 功 解决 实际 问题 的 
保障 。 

这 本 由 麻 省 理工 学 院 名 师 Michael Sipser 编撰 的 名 著 是 计算 理论 领域 的 优秀 书籍 之 一 ， 
对 于 非 纯 理 论 专业 的 人 士 ， 也 许 是 深浅 程度 最 合适 的 。 目 1996 年 第 1 版 问世 ， 该 书 历经 
近 二 十 年 ， 获 得 了 学 术 界 的 公认 和 教育 界 的 好 评 。 该 书 具 有 如 下 优点 : 

第 一 ， 内 容 丰 富 ， 编 排 合 理 ， 展 现 了 计算 机 科学 研究 的 广度 和 深度 。 该 书 以 理论 计算 
机 科学 的 知识 框架 为 脉络 ， 系 统 地 讲述 了 自动 机 与 形式 语言 、 可 计算 性 理论 和 计算 复杂 性 
理论 等 计算 理论 的 重要 内 容 。 总 体 编排 上 ， 难 度 由 浅 和 人 深 、 循 序 渐 进 ， 易 于 学 习 。 

第 二 ， 文 字 清 晰 ， 语 言 生 动 。 作 者 以 引导 、 举 例 为 叙述 手段 ， 对 计算 理论 领域 的 重要 
定理 、 性 质 等 不 仅 给 出 证 明 ， 而 且 讲 述 证 明 思 路 ， 着 力 让 读者 在 学 习 理 论 的 同时 掌握 证 明 
的 技巧 ， 彰 显 了 作者 在 此 领域 的 深厚 造 证 和 娴熟 的 教学 手法 。 

第 三 ， 各 章 设 有 练习 和 问题 ， 并 提供 了 部 分 习题 的 解答 。 通 过 作答 习题 ， 能 够 锻炼 读 
者 的 逻辑 推导 思维 ， 加 深 读者 对 关键 知识 点 的 理解 。 

我 以 切身 体会 向 计算 机 专业 的 高 年 级 本 科 生 、 硕 士 生 和 博士 生 推荐 此 书 。 我 在 本 科 阶 
段 第 一 次 接触 了 该 书 的 第 1 版 。 差 不 多 10 年 前 ， 在 刚 开始 博士 阶段 学 习 时 ， 参 与 了 本 书 
第 2 版 的 翻译 工作 。 如 今 ， 我 又 引导 我 的 学 生 学 习 这 本 书 ， 并 承担 了 第 3 版 的 翻译 工作 。 
作为 多 重 身 份 的 “过 来 人 ”， 我 有 独特 的 体会 。 一 方面 ， 该 书写 作 规范 ， 研 究 生 可 以 学 习 
到 规范 的 定义 、 性 质 、 证 明 的 表述 方式 ， 学 习 该 书 内 容 有 助 于 提升 计算 理论 素养 ， 增 强 学 
JHA; 男 一 方面 ， 人 研究 生 多 苗 于 论文 理论 深度 不 够 ,也 不 知 如 何 分 析 问 题 ， 认 真 领会 该 
书 讲述 的 证 明 思 路 和 人 解 题 思路 ， 和 常会 让 我 们 有 种 然 开 并 之 感 ， 问 题 分 析 能 力 随 之 增强 ， 进 
而 提高 研究 论文 的 水 平 。 

相 较 于 本 书 第 2 版 ,第 3 版 的 内 容 更 新 主要 在 于 增加 了 关于 确定 型 上 下 文 无 关 语 言 的 


阐述 ， 这 使 得 本 书 关 于 自动 机 理论 和 语言 处 理 的 介绍 更 为 完整 。 此 外 ， 第 3 版 对 每 章 后 的 
习题 进行 了 增补 和 重新 编排 。 除 了 对 第 3 版 新 增 和 修正 内 容 进行 翻译 以 外 ， 我 们 还 对 第 2 
版 译文 的 错误 进行 了 更 正 。 同 时 ， 我 们 尽 可 能 保持 新 版 译文 的 文风 与 第 2 版 译文 一 致 。 
本 书 由 段 舌 、 唐 第 杰 主 译 ， 王 文 帮 、 王 怡 宁 、 杨 卑 、 王 梦 洁 也 付出 了 艰辛 的 努力 。 如 
同 我 们 在 完成 本 书 第 2 版 翻译 工作 时 所 言 ， 本 书 第 3 版 的 翻译 工作 是 在 先行 者 们 工作 的 基 
础 上 ， 再 次 接 过 接力 棒 ， 把 接力 赛 再 推进 一 程 。 借 此 机 会 ， 向 本 书 第 1 版 译 者 〈 北 京 大 学 
的 张 立 昂 教授 、 王 捍 贫 教授 和 黄 雄 老 师 ) 表示 衷心 的 感谢 ,也 向 本 书 第 2 版 译 者 表示 衷心 
的 感谢 。 同 时 ， 华 章 公 司 的 姚 茧 、 朱 动 编辑 在 翻译 过 程 中 给 予 了 我 们 大 力 支 持 ， 辐 她们 表 
示 衷 心 的 感谢 。 特 别 癌 阅读 本 书 第 2 版 译文 并 给 予 我 们 翻译 指正 的 读者 表示 衷心 的 感谢 。 
由 于 水 平 有 限 ， 译 文 难免 有 错误 和 不 妥 之 处 ， 奶 请 读者 批评 指正 。 


段 & 
2015 年 6 月 于 四 川 大 学 
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本 版 新 增 了 关于 确定 型 上 下 文 无 关 语 言 的 一 节 。 我 选择 这 个 主题 有 以 下 几 个 原因 。 首 
先 ， 它 填补 了 我 之 前 对 自动 机 理论 和 语言 处 理 之 间 的 明显 空 日 。 以 前 的 版 本 介绍 了 有 穷 目 
动机 以 及 图 灵机 在 确定 型 和 非 确 定型 上 的 变形 ， 但 却 只 包含 了 下 推 目 动机 的 非 确 定型 变 
形 。 因 此 ， 增 加 关于 确定 型 下 推 自 动机 的 讨论 正如 同 找到 完成 拼图 游戏 所 缺 的 那 块 。 

其 次 ， 确 定型 上 下 文 无 关 文 法 理论 是 LRC) 文法 的 基础 ， 同 时 也 是 自动 机 理论 在 编 
程 语 言 和 编译 器 设计 上 重要 且 非 平凡 应 用 的 基础 。 这 个 应 用 将 一 些 关 键 概念 ， 包 括 确定 型 
和 非 确定 型 有 穷 自 动机 的 等 价 性 、 上 下 文 无 关 文 法 和 下 推 目 动机 之 间 的 相互 转换 ， 汇 聚 一 
起 得 到 一 个 高 效 且 漂亮 的 语法 分 析 方 法 。 这 里 我 们 实现 了 理论 和 实践 的 相互 联系 。 

最 后 ， 虽 然 该 主题 作为 自动 机 理论 一 个 真实 的 应 用 非常 重要 ， 但 它 在 现 有 理论 教 
科 书 中 却 没有 得 到 足够 重视 。 我 研究 LR(k) 文法 多 年 但 一 直 没 有 完整 理解 它们 如 何 
工作 ， 也 没有 看 到 它们 与 确定 型 上 下 文 无 关 语 言 理 论 的 完美 契合 。 我 写作 这 一 节 旨 在 
为 理论 学 者 和 实践 者 提供 关于 这 个 领域 直观 而 不 失 严谨 的 介绍 ， 并 由 此 对 该 领域 做 出 
贡献 。 需 要 注意 的 是 : 这 一 节 的 部 分 内 容 非常 具有 挑战 性 ， 因 此 基础 理论 课程 的 教师 
可 考虑 将 其 作为 补充 读物 。 之 后 的 章节 不 依赖 于 这 部 分 内 容 。 

在 撰写 本 版 的 过 程 中 ,很 多 人 给 了 我 直接 或 间接 的 帮助 。 我 很 感激 两 位 审阅 者 
Christos Kapoutsis 和 Cem Say。 他 们 阅读 了 这 一 版 新 内 容 的 初稿 ， 并 提供 了 很 有 价值 
的 反馈 意见 。 在 Cengage Learning 的 一 些 人 协助 了 本 书 的 出 版 工作 ， 特 别 是 Alyssa 
Pratt 和 Jennifer Feltri-George。 Suzanne Huizenga 编辑 了 文字 ，ByteGraphics 的 Laura 
Segel 绘制 了 新 的 图 片 并 修改 了 以 前 版 本 中 的 图 片 。 

感谢 我 在 MIT 的 助教 : Victor Chen, Andy Drucker, Michael Forbes, Elena Grigor- 
escu, Brendan Juba, Christos Kapoutsis, Jon Kelner, Swastik Kopparty, Kevin Matulef, 
Amanda Redlich, Zack Remscrim, Ben Rossman, Shubhangi Saraf, Oren Weimann。 他 们 
都 给 予 了 我 帮助 BI: 讨论 新 的 问题 并 给 出 解决 方法 ， 提 出 如 何 让 学 生理 解 课程 内 容 的 
见解 。 我 非常 享受 与 这 群 有 天 典 、 有 热情 的 年 轻 人 一 起 工作 。 

我 很 高 兴 收 到 了 来 自 世 界 各 地 的 邮件 ， 非 常 感谢 你 们 的 建议 、 问 题 和 思路 。 这 里 有 一 
个 相关 人 员 列 表 ， 他 们 的 意见 对 这 个 版 本 产生 了 影响 : 

Djihed Afifi, Steve Aldrich, Eirik Bakke, Suzanne Balik, Victor Bandur, Paul Beame, 
Elazar Birnbaum, Goutam Biswas, Rob Bittner, Marina Blanton, Rodney Bliss, Promita 
Chakraborty, Lewis Collier, Jonathan Deber, Simon Dexter, Matt Diephouse, Peter 
Dillinger, Peter Drake, Zhidian Du, Peter Fejer, Margaret Fleck, Atsushi Fujioka, Vale- 
rio Genovese, Evangelos Georgiadis, Joshua Grochow, Jerry Grossman, Andreas 
Guelzow, Hjalmtyr Hafsteinsson, Arthur Hall III, Cihat Imamoglu, Chinawat Israd- 
isaikul, Kayla Jacobs, Flemming Jensen, Barbara Kaiser, Matthew Kane, Christos 


Kapoutsis, Ali Durlov Khan, Edwin Sze Lun Khoo, Yongwook Kim, Akash Kumar, Elea- 


zar Leal, Zsolt Lengvarszky, Cheng-Chung Li, Xiangdong Liang, Vladimir Lifschitz, Ry- 
an Lortie, Jonathan Low, Nancy Lynch, Alexis Maciel, Kevin Matulef, Nelson Max, 
Hans-Rudolf Metz, Mladen Miksa, Sara Miner More, Rajagopal Nagarajan, Marvin Na- 
kayama, Jonas Nyrup, Gregory Roberts, Ryan Romero, Santhosh Samarthyam, Cem Say, 
Joel Seiferas, John Sieg, Marc Smith, John Steinberger, Nuri Tasdemir, Tamir Tassa, 
Mark Testa, Jesse Tjang, John Trammell, Hiroki Ueda, Jeroen Vaelen, Kurt L. Van 
Etten, Guillermo Vázquez, Phanisekhar Botlaguduru Venkata, Benjamin Bing-Yi Wang, 
Lutz Warnke, David Warren, Thomas Watson, Joseph Wilson, David Wittenberg, Brian 
Wongchaowart, Kishan Yerubandi, Dai Yi. 

最 重要 的 是 ， 我 要 感谢 我 的 家 人 一 -一 我 的 妻子 Ina 以 及 我 们 的 孩子 Rachel 和 Aaron, 
时 光 鞋 黄 ， 岁 月 如 梭 ， 你 们 的 爱 就 是 一 切 。 


Michael Sipser 
马萨诸塞 州 ， 剑 桥 
2012 年 4 月 
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大 量 读者 来 的 电子 邮件 反映 ， 第 1 版 没有 习题 解答 是 一 个 缺陷 。 这 一 版 弥补 了 这 一 缺 
陷 。 每 一 章 现 在 都 增加 了 “习题 选 解 ” 小 节 ， 给 出 了 该 章 的 练习 和 问题 中 有 代表 性 题目 的 
答案 。 给 出 了 答案 的 问题 就 不 能 再 作为 有 趣 的 有 挑战 性 的 家 庭 作 业 ， 为 弥补 这 一 损失 ， 又 
添加 了 若干 新 间 题 。 教 师 可 以 和 www. course. com 上 所 指定 的 相应 地 区 的 销售 代表 联系 ， 
索取 一 份 教师 手册 ， 其 中 包含 了 附加 的 答案 。 

第 2 版 的 国际 版 是 针对 国外 读者 的 。 尽 管 涵盖 了 同样 的 主题 ， 它 和 标准 第 2 版 还 是 有 
所 不 同 ， 并 且 不 是 用 来 蔡 代 标准 第 2 版 的 。 

许多 读者 更 喜欢 学 习 更 多 的 “标准 ”主题 ， 比 如 Myhill-Nerode 定理 和 Rice 定理 。 通 
过 将 这 些 主题 展示 在 给 出 答案 的 问题 中 ， 我 部 分 地 采纳 了 这 些 读 者 的 意见 。 没 有 将 My- 
hill-Nerode 定理 放 到 书本 主体 中 是 因为 我 认为 ， 这 门 课程 的 目标 是 初步 介绍 而 非 深 入 人 研究 
有 穷 自动 机 。 有 穷 自动 机 在 这 里 的 角色 是 使 学 生 通 过 研究 计算 的 简单 形式 模型 ,为 了 解 复 
FRE, AN ARAN EMRE EN PIS. SR, 一 些 人 希望 有 更 全 面 的 内 
容 ， 同 时 另 一 些 人 觉得 应 该 略 去 所 有 对 有 穷 自动 机 的 引用 (或 者 至 少 是 依赖 )。 尽 管 Rice 
定理 对 于 不 可 判定 性 的 证 明 是 一 个 有 用 的 “工具 ”， 第 2 版 还 是 没有 将 它 放 到 书本 主体 中 ， 
因为 一 些 学 生 可 能 只 是 机 械 地 使 用 它 而 没有 真正 理解 其 作用 。 换 用 归 约 来 证 明 不 可 判定 
性 ， 可 以 为 学 习 复 杂 性 理论 中 出 现 的 归 约 做 更 好 的 准备 。 

我 很 感谢 我 的 助教 Ilya Baran, Sergi Elizalde, Rui Fan, Jonathan Feldman, Ven- 
katesan Guruswami, Prahladh Harsha, Christos Kapoutsis, Julia Khodor, Adam 
Klivans, Kevin Matulef, Ioana Popescu, April Rasala, Sofya Raskhodnikova 和 Iuliu 
Vasilescu， 他 们 帮助 我 草拟 了 和 若干 新 间 题 及 其 答案 。Ching Law, Edmond Kayi Lee 和 
Zulfikar Ramzan 也 为 给 出 答案 付出 了 努力 。 感 谢 Victor Shoup 提出 了 一 个 简洁 的 方法 ， 
用 于 修整 在 第 1 版 中 出 现在 概率 原始 算法 分 析 中 的 缺陷 。 

感谢 Course Technology 出 版 社 的 编辑 们 的 努力 ， 尤 其 是 Alyssa Pratt 和 Aimee Poiri- 
er。 多 谢 Gerald Eisman, Weizhen Mao, Rupak Majumdar, Chris Umans 和 Christopher 
Wilson 所 做 的 审 校 。 感 谢 Jerry Moore 在 编辑 上 的 出 色 工 作 ， 还 有 ByteGraphics 的 Laura 
Segel (lauras@bytegraphics. com) 精彩 而 又 精确 的 图 表 再 现 。 

我 所 收 到 的 电子 邮件 数量 超 乎 预料 。 收 到 来 自 这 么 多 地 方 的 这 么 多 人 的 来 信 绝 对 是 一 
种 快乐 。 我 会 尽量 回复 并 向 我 未 曾 回复 者 表示 妇 意 。 我 在 此 列 出 对 本 书 第 2 版 提供 了 有 益 
的 建议 的 人 ， 同 时 对 所 有 给 我 来 信 的 人 表示 感谢 。 

Luca Aceto, Arash Afkanpour, Rostom Aghanian, Eric Allender, Karun Bakshi, 
Brad Ballinger, Ray Bartkus, Louis Barton, Arnold Beckmann, Mihir Bellare, Kevin 
Trent Bergeson, Matthew Berman, Rajesh Bhatt, Somenath Biswas, Lenore Blum, 
Mauro A. Bonatti, Paul Bondin, Nicholas Bone, Ian Bratt, Gene Browder, Doug Burke, 


Sam Buss, Vladimir Bychkovsky, Bruce Carneal, Soma Chaudhuri, Rong-Jaye Chen, 


Samir Chopra, Benny Chor, John Clausen, Allison Coates, Anne Condon, -Jeffrey Con- 
sidine, John J. Crashell, Claude Crepeau, Shaun Cutts, Susheel M. Daswani, Geoff Da- 
vis, Scott Dexter, Peter Drake, Jeff Edmonds, Yaakov Eisenberg, Kurtcebe Eroglu, 
Georg Essl, Alexander T. Fader, Farzan Fallah, Faith Fich, Joseph E. Fitzgerald, Perry 
Fizzano, David Ford, Jeannie Fromer, Kevin Fu, Atsushi Fujioka, Michel Galley, 
K. Ganesan, Simson Garfinkel, Travis Gebhardt, Peymann Gohari, Ganesh Go- 
palakrishnan, Steven Greenberg, Larry Griffith, Jerry Grossman, Rudolf de Haan, Mi- 
chael Halper, Nick Harvey, Mack Hendricks, Laurie Hiyakumoto, Steve Hockema, 
Michael Hoehle, Shahadat Hossain, Dave Isecke, Ghaith Issa, Raj D. Iyer, Christian 
Jacobi, Thomas Janzen, Mike D.Jones, Max Kanovitch, Aaron Kaufman, Roger 
Khazan, Sarfraz Khurshid, Kevin Killourhy, Seungjoo Kim, Victor Kuncak, Kanata 
Kuroda, Suk Y. Lee, Edward D. Legenski, Li-Wei Lehman, Kong Lei, Zsolt Leng- 
varszky, Jeffrey Levetin, Baekjun Lim, Karen Livescu, Thomas Lasko, Stephen Louie, 
TzerHung Low, Wolfgang Maass, Arash Madani, Michael Manapat, Wojciech 
Marchewka, David M. Martin Jr. , Anders Martinson, Lyle McGeoch, Alberto Medina, 
Kurt Mehlhorn, Nihar Mehta, Albert R. Meyer, Thomas Minka, Mariya Minkova, Dai- 
chi Mizuguchi, G. Allen Morris []|, Damon Mosk-Aoyama, Xiaolong Mou, Paul Muir, 
German Muller, Donald Nelson, Gabriel Nivasch, Mary Obelnicki, Kazuo Ohta, Thom- 
as M. Oleson, Jr. , Curtis Oliver, Owen Ozier, Rene Peralta, Alexander Perlis, Holger 
Petersen, Detlef Plump, Robert Prince, David Pritchard, Bina Reed, Nicholas Riley, 
Ronald Rivest, Robert Robinson, Christi Rockwell, Phil Rogaway, Max Rozenoer, 
John Rupf, Teodor Rus, Larry Ruzzo, Brian Sanders, Cem Say, Kim Schioett, Joel Se- 
iferas, Joao Carlos Setubal, Geoff Lee Seyon, Mark Skandera, Bob Sloan, Geoff Smith, 
Marc L. Smith, Stephen Smith, Alex C.Snoeren, Guy St-Denis, Larry Stockmeyer, 
Radu Stoleru, David Stucki, Hisham M. Sueyllam, Kenneth Tam, Elizabeth Thompson, 
Michel Toulouse, Eric Tria, Chittaranjan Tripathy, Dan Trubow, Hiroki Ueda, Giora 
Unger, Kurt L. Van Etten, Jesir Vargas, Bienvenido Velez-Rivera, Kobus Vos, Alex 
Vrenios, Sven Waibel, Marc Waldman, Tom Whaley, Anthony Widjaja, Sean Wil- 
liams, Joseph N. Wilson, Chris Van Wyk, Guangming Xing, Vee Voon Yee, Cheng 
Yongxi, Neal Young, Timothy Yuen, Kyle Yung, Jinghua Zhang, Lilla Zollei, 

当 我 夜以继日 地 坐 在 我 的 电脑 屏幕 前 时 ， 尤 其 要 感谢 我 的 家 人 Ina, Rachel 和 Aaron 
的 耐心 、 理 解 和 爱 。 


Michael Sipser 
马萨诸塞 州 ， 剑 桥 
2004 年 12 月 
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写 给 学 生 


欢迎 使 用 本 书 ! 

将 要 开始 学 习 的 是 重要 而 又 引人入胜 的 课题 ,计算 理论 。 它 包括 计算 机 硬件 、 软 件 以 
及 茶 些 应 用 的 基本 数学 特性 。 这 一 课程 试图 回答 什么 是 不 能 计算 的 ， 什 么 是 能 计算 的 ， 可 
以 算 多 快 ， 要 用 多 少 存储 ， 以 及 采用 什么 计算 模型 等 。 这 些 问 题 与 工程 实践 有 着 紧密 的 联 
系 ， 也 具有 纯 理 论 的 一 面 。 

许多 同学 主动 盼望 学 习 这 门 课 程 ， 有 些 同学 可 能 只 是 为 了 完成 计算 机 科学 或 者 计算 机 
工程 的 学 位 必需 的 理论 课程 学 分 一 一 他 们 也 许 认为 理论 比较 神秘 、 难 学 且 用 处 不 大 。 

通过 学 习 ， 读 者 会 发 现 理 论 既 不 神秘 、 也 不 讨厌 ， 是 好 理解 、 甚 至 是 有 趣 的 。 理 论 计 
算 机 科学 有 许多 迷人 而 重要 的 思想 ， 同 时 它 也 有 许多 细小 的 、 有 时 甚至 是 乏味 的 细节 ， 这 
些 细节 可 能 令 人 感到 厌倦 。 学 习 任 何 一 门 新 的 课程 都 是 一 件 艰 苦 的 工作 。 但 是 ， 如 果 能 把 
它 适当 地 表述 出 来 ， 和 学 习 就 会 变 得 容易 和 更 愉快 些 。 本 书 的 一 个 基本 目标 是 让 读者 接触 到 
计算 理论 中 真正 令 人 激动 的 方面 ， 而 不 陷入 单调 乏味 之 中 。 当 然 ， 对 理论 感 兴趣 的 唯一 途 
Eke BARFAFSRE . | 

理论 与 实践 是 密切 联系 的 ， 计 算 理 论 为 实际 工作 者 提供 了 在 计算 机 工程 中 使 用 的 理性 
工具 。 要 为 具体 的 应 用 设计 一 个 新 的 程序 设计 语言 吗 ? 本 课程 中 关于 语法 的 内 容 迟 早 是 会 
有 用 的 。 要 进行 字符 串 搜 索 和 模式 匹配 吗 ? 不 要 忘 了 有 穷 自 动机 和 正则 表达 式 。 遇 到 了 一 
个 看 来 需要 比 你 能 够 提供 的 计算 机 时 间 还 要 多 的 问题 吗 ? 想 一 想 你 学 过 的 有 关 NP 完全 性 
的 内 容 。 各 种 应 用 领域 ， 如 现代 密码 协议 ， 都 依赖 于 在 这 里 将 要 学 习 的 理论 原则 。 

理论 是 有 意义 的 ， 它 回 读 者 展示 了 计算 机 新 的 、 简 单 的 、 更 加 优美 的 一 面 ， 而 通常 我 
们 把 计算 机 看 作 一 台 复 杂 的 机 堪 。 最 好 的 计算 机 设计 和 应 用 出 自 完 美的 构思 。 一 门 理论 课 
程 可 以 提高 审美 意识 ， 帮 助 读 者 建立 更 加 优秀 的 系统 。 

理论 是 实践 的 指南 ， 学 习 理论 能 够 扩展 你 的 思维 。 计 算 机 技术 更 新 很 快 ， 专 门 的 技术 
知识 虽然 今天 有 用 ， 但 是 仅仅 在 几 年 内 就 会 变 成 过 时 的 东西 。 而 能 力 具 有 持久 的 价值 ， 课 
程 应 该 注重 培养 思考 能 力 、 清 楚 准 确 的 表达 能 力 、 解 决 问题 的 能 力 以 及 知道 问题 什么 时 候 
还 没有 解决 的 能 力 ， 理 论 能 够 训练 这 些 能 力 。 

除了 实际 的 考虑 ， 几 乎 每 一 位 使 用 计算 机 的 人 都 想 了 解 这 个 神奇 的 创造 ， 它 的 能 力 ， 
以 及 它 的 局 限 性 。 为 了 解答 某 些 基本 问题 ， 在 过 去 的 30 年 里 ， 一 个 全 新 的 数学 分 支 已 经 
确立 。 这 里 还 有 一 个 重大 问题 没有 解决 : 如 果 给 定 大 的 自然 数 ， 例 如 有 500 位 ， 能 够 在 合 
理 的 时 间 内 把 它 分 解 成 素数 的 乘积 吗 ? 即使 使 用 一 台 超 级 计算 机 ， 现 今 还 没 人 知道 怎样 才 
能 在 宇宙 毁灭 之 前 做 完 这 件 事 ! 因子 分 解 问题 与 现代 密码 系统 中 的 某 些 密码 有 关 。 去 寻找 
一 个 快速 的 因子 分 解 方法 吧 ， 也 许 ， 读 者 会 因此 而 一 举 成 名 ! 
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本 书 是 计算 机 学 科 高 年 级 本 科 生 或 研究 生 的 计算 理论 入 门 教材 。 它 涉及 计算 理论 的 数 
学 论述 ， 包 括 叙 述 和 证 明定 理 的 基本 技能 。 作 者 努力 使 本 书 适用 于 那些 缺乏 定理 证 明 的 基 
本 训练 的 学 生 ， 当 然 ， 有 较 多 这 种 经 验 的 学 生 会 学 习 得 更 轻松 。 

强调 清楚 和 生动 是 本 书 叙 述 的 一 个 特色 ， 本 课程 对 某 些 低层 次 的 细节 强调 了 直觉 和 
“大 的 轮廓 >。 例如， 虽然 在 第 0 章 介 绍 了 证 明 的 归纳 法 以 及 其 他 的 数学 预备 知识 ， 但 在 后 
面部 分 它 并 不 是 重点 。 关 于 目 动 机 的 各 种 构造 方法 的 正确 性 ， 一 般 不 用 归纳 证 明 。 只 要 令 
述 清 楚 ， 这 些 构 造 方法 已 经 是 令 人 信服 的 ， 不 需 进一步 论证 。 归 纳 证 明 反而 可 能 把 学 生 搞 
糊涂 而 不 是 给 人 以 局 迪 。 归 纳 法 是 比较 复杂 的 技术 ， 可 能 还 有 些 神 秘 。 对 十 分 明显 的 事情 
用 归纳 法 作 反 复 的 说 明 可 能 会 化 简 为 繁 、 违 反 初 衷 ， 使 学 生 认 为 数学 证 明 是 一 种 形式 化 手 
法 ， 而 不 是 教 给 他 们 懂得 什么 是 有 说 服 力 的 证 据 ， 什 么 不 是 有 说 服 力 的 证 据 。 

本 书 第 二 部 分 和 第 三 部 分 没有 采用 伪 码 描述 算法 ， 而 用 了 上 自然 语言 描述 。 书 中 没有 秦 
很 多 时 间 去 设计 图 灵机 (或 任何 其 他 形式 模型 ) 的 程序 。 现 在 的 学 生 都 有 程序 设计 的 经 
历 ， 觉 得 丘 奇 -图 灵 论 题 是 不 言 自明 的 。 因 此 我 不 去 用 很 长 的 篇 幅 投 述 用 一 个 模型 模拟 为 
一 个 模型 来 说 明 它 们 的 等 价 性 。 

除 增 加 直观 性 和 压缩 某 些 细节 外 ， 本 书 内 容 组 织 符合 计算 理论 中 的 典型 标准 。 理 论 工 
作者 将 发 现 ， 素材 的 选取 、 术 语 以 及 内 容 的 前 后 顺序 都 与 其 他 广泛 使 用 的 教材 一 致 。 只 在 
少数 地 方 ， 当 我 发 现 标 准 的 术语 十 分 模糊 或 会 引起 混 涌 时 ， 才 引进 了 新 的 术语 。 例 如 ， 引 
进 名 词 映 射 可 归 约 性 代替 多 一 可 归 约 性 。 

习题 是 学 习 与 数学 相关 的 科学 必 不 可 少 的 环节 。 书 中 的 习题 分 成 两 大 类 ， 练 习 用 来 复 
习 定 义 和 概 念 。 问 题 需要 多 动 些 脑筋 。 带 星 号 的 问题 更 难 一 些 。 本 书 努 力 使 练习 和 问题 令 
人 感 兴 趣 ， 并 有 挑战 性 。 
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本 章 先 概述 了 本 书 中 讲述 的 计算 理论 涉及 的 范围 ， 然 后 学 习 或 者 复习 一 些 后 面 需要 用 
到 的 数学 知识 。 


0.1 自动 机 、 可 计算 性 与 复杂 性 


本 书 重 点 在 计算 理论 的 三 个 传统 的 核心 领域 : 自动 机 、 可 计算 性 和 复杂 性 。 是 什么 将 
这 三 个 领域 联系 在 一 起 的 呢 ? 这 就 是 : 

计算 机 的 基本 能 力 和 局 限 性 是 什么 ? 
要 回答 这 个 问题 应 追溯 到 20 世纪 30 年 代 ， 当 时 的 数理 逻辑 学 家 们 首先 开始 探究 什么 是 计 
算 。 目 那 时 起 ， 计 算 机 技术 的 发 展 显著 地 增强 了 人 们 的 计算 能 力 ， 并 且 把 这 个 问题 从 理论 
王国 带 到 人 们 关心 的 现实 世界 。 

对 这 三 个 领域 (自动 机 、 可 计算 性 和 复杂 性 ) 中 的 任 一 个 领域 ， 人 们 都 会 对 这 个 问题 
做 出 不 同 的 解释 ， 并 且 对 不 同 的 解释 会 有 各 不 相同 的 答案 。 在 本 和 草 之 后 ， 本 书 就 这 三 个 领 
域 中 的 每 个 领域 分 别 独立 介绍 。 在 此 ， 我们 以 相反 的 顺序 〈 复 杂 性 、 可 计算 性 、 目 动机 ) 
介绍 这 些 领 域 ， 因 为 这 样 能 够 帮助 大 家 更 好 地 理解 本 书 的 内 容 。 


0.1.1 计算 复杂 性 理论 


现实 中 ， 计 算 的 问题 是 多 种 多 样 的 ， 有 的 容易 ， 有 的 困难 。 例 如 ， 排 序 是 一 个 容易 的 
问题 ， 按 升序 排列 一 张 数字 表 ， 即 使 一 台 小 型 计算 机 也 能 迅速 处 理 100 万 个 数 。 相 对 于 时 
间 表 问题 而 言 ， 比 如 要 制定 某所 大 学 的 课程 表 ， 课 程 表 必须 满足 某 些 合理 的 限制 〈 比 如 不 
能 有 两 个 班 在 同一 时 间 使 用 同一 教室 )。 时 间 表 问题 似乎 比 排序 问题 复杂 得 多 。 如 果 有 
1000 个 班 需 要 排 课 ， 即 使 我 们 使 用 一 台 超 级 计算 机 ， 也 可 能 需要 花 铬 干 世 纪 的 时 间 才 能 
制定 出 一 份 最 好 的 课程 表 。 

那么 是 什么 使 得 菜 些 问题 很 难 计算 ， 而 又 使 另 一 些 问题 容易 计算 呢 ? 

这 就 是 复杂 性 理论 的 核心 问题 。 值 得 注意 的 是 ， 尽 管 在 过 去 的 40 多 年 里 对 该 问题 进行 了 
深入 细致 的 研究 ， 但 是 我 们 至 今 仍然 没有 它 的 答案 。 接 下 来 ， 我 们 将 探究 这 个 迷人 的 问题 
以 及 它 的 一 些 分 支 领 域 。 

到 目前 为 止 ， 科 研 工 作者 发 现 了 一 个 根据 计算 难度 给 问题 分 类 的 完美 体系 ， 这 是 复杂 性 
理论 的 一 个 重要 成 果 。 它 类 似 于 按照 化 学 性 质 给 元 素 分 类 的 周期 表 。 按 照 该 体系 ， 即 使 我 们 
还 不 能 证 明 问 题 是 难 计算 的 ， 但 也 能 够 提出 一 种 给 出 某 些 问 题 是 难 计算 的 证 据 的 方法 。 

当面 对 一 个 似乎 很 难 计 算 的 问题 时 ， 往 往 会 有 者 干 选择 。 首 先 ， 通 过 弄 清 问题 困难 的 
根源 ， 我 们 可 能 会 做 某 些 改动 ， 使 问题 变 得 容易 解决 。 其 次 ， 我 们 可 能 会 转 而 去 求 问 题 的 
一 个 并 不 完美 的 解 。 在 某 些 情况 下 ， 寻 找 问 题 的 近似 最 优 解 会 相对 容易 一 些 。 再 者 ， 有 些 
问题 仅仅 在 最 坏 的 情况 下 是 困难 的 ， 而 在 绝 大 多 数 情 况 下 是 容易 的 。 就 应 用 而 言 ， 一 个 偶 
尔 运 行 得 很 慢 而 通常 运行 得 很 快 的 程序 是 能 够 令 人 满意 的 。 最 后 也 可 以 选择 其 他 计算 类 
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型 ， 如 能 够 加 速 某 些 计算 任务 的 随机 计算 。 

受到 复杂 性 理论 直接 影响 的 一 个 应 用 领域 是 密码 技术 ， 这 是 一 个 古老 的 研究 领域 。 在 
绝 大 多 数 领域 中 ， 选 择 容 易 计 算 的 问题 比 选择 难 计算 的 问题 更 可 取 ， 因 为 求解 容易 问题 的 
代价 更 小 。 密 码 技术 与 众 不 同 ， 它 特别 需要 难 计算 的 问题 ， 而 不 是 容易 计算 的 问题 。 因 为 
在 不 知 密 钥 或 口令 时 ， 密 码 应 该 是 很 难 破解 的 。 复 杂 性 理论 给 密码 研究 人 员 指 出 了 寻找 难 
计算 问题 的 方向 ， 围 绕 这 些 问题 他 们 已 经 设计 出 新 的 创造 性 的 编码 。 


0. 1.2 可 计算 性 理论 


在 20 世纪 前 半 叶 ， 像 哥 德 尔 (Kurt Gödel), AR (Alan Turing) REA (Alonzo 
Church) 这 样 的 数学 家 们 ， 发 现 一 些 基 本 问题 是 不 能 用 计算 机 解决 的 。 确 定 一 个 数学 命题 
是 真 或 是 假 就 是 这 样 一 个 例子 。 这 项 任务 是 数学 家 们 的 工作 ， 因 为 它 属 于 数学 王国 的 范 
畴 ， 所 以 用 计算 机 来 解决 似乎 很 自然 。 但 是 ， 没 有 计算 机 算法 能 够 完成 这 项 任务 。 

关于 计算 机 理论 模型 思想 的 发 展 就 是 这 一 具有 深远 意义 的 研究 成 果 之 一 ， 它 最 终 会 帮 
助人 们 制造 出 实用 的 计算 机 。 

可 计算 性 理论 与 复杂 性 理论 是 密切 相关 的 。 在 复杂 性 理论 中 ， 目 标 是 把 问题 分 成 容易 
计算 的 和 难 计算 的 ; 而 在 可 计算 性 理论 中 ， 是 把 问题 分 成 可 解 的 和 不 可 解 的 。 可 计算 性 理 
论 引 人 了 一 些 在 复杂 性 理论 中 使 用 过 的 概念 。 


0. 1.3 自动 机 理论 


目 动 机 理论 阐述 了 计算 的 数学 模型 的 定义 和 性 质 。 这 些 模型 在 计算 机 科学 的 若干 应 用 
领域 中 起 着 作用 。 一 个 模型 是 有 穷 自动 机 模型 ， 它 用 在 文本 处 理 、 编 译 程序 以 及 硬件 设计 
中 ; 夯 一 个 模型 是 上 下 文 无 关 文 法 模型 ， 它 用 在 程序 设计 语言 和 人 工 智能 中 。 

自动 机 理论 是 学 习 计算 理论 的 非常 好 的 起 点 。 可 计算 性 理论 和 复杂 性 理论 需要 对 计算 
机 给 出 一 个 准确 的 定义 。 目 动机 理论 让 我 们 在 介绍 与 计算 机 科学 的 其 他 非 理论 领域 有 关 的 
概念 时 可 以 使 用 计算 的 形式 化 定义 。 


0.2 数学 概念 和 术语 


与 任何 数学 科目 一 样 ， 开 始 时 ， 我 们 先 讨 论 一 下 预计 要 用 到 的 基本 的 数学 对 象 、 工 具 


0.2.1 集合 


集合 (set) 是 一 组 对 象 ， 把 它 看 成 一 个 整体 。 集 合 可 以 包含 任何 类 型 的 对 象 ， 包 括 
数 、 符 号 甚至 其 他 集合 。 集 合 中 的 对 象 称 为 它 的 元 素 (element) 或 成 员 (member)。 集 
合 可 以 用 几 种 方式 形式 化 地 描述 。 一 种 方式 是 在 大 括号 内 列 出 它 的 元 素 。 例 如 ， 集 合 

《7 
包含 元 素 7，21 和 57。 符 号 多 和 秋分 别 表示 集合 成 员 和 非 集合 成 员 。 如 ，7E{(7,21,57)， 
8E (17,21,57}。 对 于 A 和 B 这 两 个 集合 ， 如 果 A 的 每 个 成 员 也 是 B 的 成 员 ， 则 称 A 为 B 
的 子 集 (subset)， 记 作 ACB. WR A 为 B 的 子 集 上 且 不 等 于 B， 则 称 A 为 B 的 真子 集 
(proper subset), WF A CB. 
集合 与 描述 它 的 元 素 的 排列 顺序 无 关 ， 也 不 考虑 其 元 素 的 重复 。 {57,7,7,7,21) 和 


{7,21,57} 表示 同一 个 集合 。 如 果 确 实 要 考虑 元 素 出 现 的 次 数 ， 则 把 它 称 作 多 重 集 合 
(multiset), Pa, {7} 和 {7, D) 作为 多 重 集 合 是 不 相同 的 两 个 集合 ， 而 作为 集合 是 同 
一 个 集合 。 无 穷 集 合 (infinite set) 是 包含 无 穷 多 个 元 素 的 集合 。 不 可 能 列 出 无 穷 集 合 的 


所 有 元 素 ， 所 以 有 时 用 记号 “…” 表 示 “ 集 合 的 元 素 序列 将 永远 继续 下 去 ”。 因 此 ， 我 们 
把 自然 数 集 (set of natural numbers) N BW 
A y #85} 


把 整数 集 (set of integers) Z BW 

eens Rene Bae Meee 
不 含 任何 元 素 的 集合 称 作 空 集 (empty set), CAS. HH, G€KRAHE——PURAM, 
则 把 它 称 作 单元 素 集合 (singleton set); 若 集合 恰好 只 包含 两 个 不 同 元素 ， 则 被 称 作 二 元 
集合 (unordered pair). 

当 我 们 描述 由 服从 某 种 规则 的 元 素 组 成 的 集合 时 ， 通 常 写 为 {n | KF 的 规则 }。 例 
如 ，{n | 对 于 某 个 mE N，n 二 m?}， 它 表示 由 完全 平方 数组 成 的 集合 。 

对 给 定 的 两 个 集合 A 和 B, 把 A 和 B 中 的 所 有 元 素 合 并 为 一 个 大 集合 ， 这 样 得 到 的 
集合 称 为 A 和 B 的 并 集 (union)， 记 为 AUB。 既 在 A 中 又 在 B 中 的 所 有 元 素 组 成 的 集合 
称 为 A 和 B 的 交集 (intersection)， 记 为 A 门 B。 所 有 需要 考虑 的 、 但 不 在 A 中 的 元 素 组 
成 的 集合 称 为 A 的 补 集 (complement), WX A. 

数学 中 通常 用 形象 化 的 图 形 来 帮助 阐明 某 个 概念 。 对 于 和 集合， 我 们 采用 所 谓 的 文 氏 图 
(Venn diagram) 来 描述 。 通 常 把 集合 表示 为 圆圈 围 成 的 区 域 。 例 如 ， 在 图 0-1 中， 用 
“以 t+ 开头 ”这 个 图 来 表示 以 字母 “t” 开 头 的 英文 单词 组 成 的 集合 。 图 中 的 圆圈 表示 “以 
t 开头 ”的 集合 ， 人 集合 的 几 个 元 素 表 示 为 圆 内 的 几 个 点 。 

类 似 地 ， 在 图 0- 2 中 的 圆圈 表示 以 字母 “z” 结 尾 的 英文 单词 组 成 的 集合 。 


以 t 开 头 以 z 结 尾 
terrific quartz 
tundra jazz 
theory razzmatazz 


图 0-1 A “P 开头 的 英文 单词 集合 的 文 氏 图 图 0-2 以 “z” 结 尾 的 英文 单词 集合 的 文 氏 图 


如 果 在 同一 个 文 氏 图 中 表示 两 个 以 上 的 集合 ， 为 了 表明 它们 具有 某 些 共同 的 元 素 ， 应 
该 把 它们 画 成 部 分 重奏 在 一 起 ， 如 图 0- 3 所 示 。 例 如 ， 单 词 topaz 就 是 在 两 个 集合 中 。 图 
中 还 有 一 个 圆圈 表示 “以 j 开头 ”的 集合 ， 由 于 没有 任何 一 个 单词 同时 在 这 两 个 集合 中 ， 


PRUE Alea “VA t FPS” HAERERE. 


图 0-4 中 的 两 个 文 氏 图 描述 了 集合 A 和 B 的 并 集 和 交集 。 
topaz Jazz (a) AUB (b) ANB 


以 开头 ”以 z 开 头 URFA 
图 0-3 圆 的 重 到 部 分 表明 有 共同 元 素 图 0-4 表示 并 集 和 交集 的 文 氏 图 
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0.2.2 序列 和 多 元 组 


序列 (sequence) 是 某 些 元 素 或 成 员 按 某 种 顺序 排 成 的 一 个 列表 。 通 常 把 它 写 在 一 对 

圆 括号 内 指明 它 为 一 个 序列 。 人 例如， 序列 7,21,57 可 写 为 

(7,21,57) 
在 集合 中 可 不 考虑 元 素 的 顺序 ， 但 在 序列 中 要 考虑 元 素 的 顺序 。 因 此 ， (7,21,57) 和 
(57,7,21) 是 两 个 不 同 的 序列 。 类 似 地 ， 在 集合 中 元 素 是 否 重 复 无 关 紧 要 ， 而 在 序列 中 元 
素 是 否 重 复 却 很 重要 。 例 如 序列 (7,7,21,57) 与 前 两 个 序列 都 不 相同 ， 而 集合 (7,21, 
57} 与 《7,7,21,57} 是 相同 的 集合 。 

与 集合 一 样 ， 序 列 也 可 以 是 有 穷 序列 或 者 无 穷 序 列 。 通 常 把 有 穷 序 列 称 为 多 元 组 
(tuple) 。 上 个 元 素 的 序列 称 为 & 元 组 (Atuple) 。 例 如 ，(7,21,57) 为 一 个 3 元 组 。2 元 组 
也 称 为 有 序 对 (ordered pair). 

集合 与 序列 可 以 作为 其 他 集合 或 序列 的 元 素 。 例 如 ，A WHH (power set) 为 A 的 
所 有 子 集 的 集合 。 设 A 为 集合 {0,1}， 则 A 的 寡 集 为 集合 {名 ,{0),{1}),{0,1}}。 元 素 为 
0 和 1 的 所 有 有 序 对 组 成 的 集合 为 {(0,0),(0,1),(1,0),(1,1)}。 

设 A 和 B 为 两 个 集合 ，A 和 BA BEILA (Cartesian product) 或 叉 积 (cross product) 
为 这 样 一 个 集合 ， 它 是 第 一 个 元 素 为 A 的 元 素 、 第 二 个 元 素 为 B 的 元 素 的 所 有 有 序 对 组 
成 的 集合 ， 记 作 AXB。 

URED i A=—({1,2} A B=({z,y,z}, W 


AX B=t€1 sa) C1) Clee) (252) s As) a aa a 
还 可 以 有 有 个 集合 Al A2, Ar 的 笛 卡 儿 积 ， 记 为 AliXAzX…XAk。 它 是 由 所 有 k 
70 2A its Ua Tey ap) 组 成 的 集合 ， 其 中 Wi E A;. 


gees 设 A 和 B 两 个 集合 与 例 0.1 中 的 A、B 相同 ， 则 
AM BK = Cleese lses2os Clive lA 
CT seg) lm lt 
和 m 
集合 自身 的 笛 卡 儿 积 可 采用 如 下 缩写 形式 : 


k 
”一 一 一 
AXAX XA = A? 
UR 集合 N: 等 于 NXN。 它 是 由 所 有 自然 数 的 有 序 对 组 成 的 集合 ， 也 可 以 写 为 
A | 


0.2.3 函数 和 关系 


HAMA., KAE O., A% (unction) 是 一 个 建立 输入 -输出 关系 的 对 象 。 它 得 
到 一 个 输入 ， 产 生 一 个 输出 。 对 于 每 一 个 函数 ， 同 样 的 输入 总 会 产生 同样 的 输出 。 设 f 是 
一 个 函数 ， 当 输入 值 为 a 时 它 的 输出 值 为 2， 则 记 为 
f(a)=6 
pki tM BRA RR GT (mapping), FFA. Æ f(a) 二 56， 则 称 f 把 a 映射 为 5。 
PON, Xt HA OE RZ ab5s， 取 一 个 数 z 作为 它 的 输入 ， 当 工大 于 等 于 0 时 该 函数 返回 


BOF g te 5 


x; 当 工 小 于 0 时 该 函数 返回 一 +。 因 此 ，abs(2) 二 abs( 一 2) = 二 2。 加 法 是 函数 的 男 一 个 例 
子 ， 记 为 add。 加 法 函数 的 输入 是 由 两 个 数组 成 的 有 序 对 ， 输 出 是 这 两 个 数 之 和 。 

果 数 的 所 有 可 能 的 输入 组 成 的 集合 称 为 函数 的 定义 域 (domain) pa AC AY fi h tL KE A 
于 另 一 个 集合 ， 这 个 集合 称 为 函数 的 值 域 (range) 。 对 于 函数 f+， 采 用 如 下 方式 表述 其 定 
义 域 为 D 和 值 域 为 R: 

f:D—>R 

如 果 限 制 在 整数 范围 内 ， 函 数 abs 的 定义 域 和 值 域 都 为 Z， 可 以 写 为 abs:Z 一 Z。 对 于 整数 
的 加 法 函数 ， 如 果 定 义 域 为 整数 有 序 对 集合 ZXZ， 而 值 域 为 Z， 则 可 以 写 为 add: ZX 
Z>Z, TER: 因数 不 必 取 得 指定 值 域 的 所 有 元 素 。 虽 然 一 1EZ， 但 是 函数 abs 绝 不 会 取 到 
值 一 1。 如 果 函 数 取得 值 域 的 所 有 元 素 ， 则 称 它 映 上 Conto) 到 这 个 值 域 。 

通常 可 以 用 几 种 方法 描述 一 个 具体 的 函数 。 其 中 一 种 方法 是 采用 从 指定 的 输入 到 输出 
的 计算 过 程 。 而 另 一 种 方法 是 用 一 张 表 列 出 所 有 可 能 的 输入 和 对 应 的 输出 。 

URES 考虑 函数 f:{0,1,2,3,4} 一 {0,1,2,3,4})。 


n SF 1 2s 4 
jot 232 4 6 
该 函数 为 把 它 的 输入 加 1， 然 后 输出 再 执行 模 5 后 的 计算 结果 。 通 常 ， 对 于 一 个 数 的 模 
m 的 结果 就 等 于 该 数 除 以 m 后 所 得 到 的 余数 。 例如， 钟表 表盘 上 的 分 针 按 模 60 计数 。 
当 作 模 运 算 时 ， 记 为 Z 二 {10,1,2,…,m 一 1}。 用 这 个 记号 ， 前面 提 到 的 函数 f 可 以 写 
为 f:Zs 一 Zs 。 网 
GED 如 果 函 数 的 定义 域 为 两 个 集合 的 笛 卡 儿 积 ， 这 时 需要 使 用 2 维 表格 来 描 
述 。 在 这 里 有 另 一 个 函数 9:Z4 XZ ->Z4 。 它 表示 标号 为 i 的 行 和 标号 为 j 的 列 的 内 容 是 
9(i,7) 的 值 。 





PR 9 为 模 4 AY DTK eH a 

“4 PRI f WE MIRA AL XA;X…XA 时 ，f 的 输入 是 有 元 组 Ca az，… an), PR a; 
为 了 的 自 变量 (argument), 个 自 变 量 的 图 数 称 为 & 元 函数 (kary function), k KAR 
数 的 元 数 (arity)。 当 有 R 等 于 1 时 ， 三 有 一 个 自 变 量 ， 称 为 一 元 函数 (unary function), 4 
& 等 于 2 时 ，7 为 二 元 函数 (binary function) 。 将 某 些 大 家 熟悉 的 二 元 图 数 写 为 特殊 的 中 
缀 表示 法 (infix notation) 的 形式 ， 即 把 函数 符号 放 在 它 的 两 个 自 变 量 之 间 ， 而 不 采用 前 
缀 表示 法 (prefix notation) ÆRA SKERA M. Ain, WMA KA add 通常 采用 中 绥 表 
示 法 把 符号 “十 ” 放 在 两 个 自 变量 之 间 ， 写 为 十。 代替 采用 前 缀 表示 法 add(a,b). 

谓词 (predicate) 或 性 质 (property) 是 一 种 函数 ， 它 的 值 域 为 (TRUE,FALSE}. 
例如 ， 设 even 为 一 个 谓词 ， 当 输入 为 偶数 时 该 函数 的 输出 为 TRUE; 当 输 入 为 奇数 时 该 


pki AC AY 4a HH A FALSE, Am, even(4)=TRUE, even(5)=FALSE, 

定义 域 为 A* 的 谓词 称 为 关系 (relation)， 或 称 为 上 元 关系 (kary relation), ERX 
A 上 的 & 元 关系 。 通 常用 的 是 二 元 关系 (binary relation) 。 当 我 们 书写 一 个 包含 二 元 关系 
的 表达 式 时 ， 习 惯 上 采用 中 组 表示 法 。 例 如 , “小 于 ”是 一 个 关系 ， 通 常 写成 带 中 级 符 号 
“<” HEAR. “等 于 ”是 大 家 熟悉 的 另 一 个 关系 ， 写 为 带 中 级 符号 “ 王 ” 的 形式 。 设 尺 是 
一 个 二 元 关系 ， 则 命题 aRb 表示 aRbD=TRUE, KH, HRRH—TPR 元 关系 ， 则 命题 R 
(alsa2，"… ak) 表示 R(ai,azs,*…,arx) 一 TRUE。 

在 一 个 叫 作 剪刀 一 布 一 石头 的 儿童 游戏 中 ， 两 个 人 同时 选择 集合 《剪刀 ， 
A, Ak) 中 的 任 一 个 元 素 ， 并 且 用 手势 表示 出 来 。 如 果 两 个 人 的 选择 是 相同 的 ， 则 游戏 
重 来 。 如 果 选 择 不 相同 ， 则 按照 下 述 打 败 关 系 ， 确 定 一 个 人 获胜 。 





剪刀 FALSE TRUE FALSE 
布 FALSE FALSE TRUE 
石头 TRUE FALSE FALSE 
根据 这 张 表 ， 前 刀 打 败 布 为 TRUE， 而 布 打败 前 刀 为 FEALSE。 z 


有 时 用 集合 代替 函数 来 描述 谓词 更 方便 一 些 。 例 如 ， 谓 词 P: D> (TRUE, FALSE} 
可 以 写成 (D,S)， 其 中 S={a€ D|Pla)=TRUE}, 或 当 根 据 上 下 文 定义 域 D 是 明显 的 
时 候 ， 简 单 地 写成 S。 于 是 ， 打 败 关系 可 以 写 为 如 下 形式 : 

(CHAA) MAk) ERA) 

等 价 关 系 (equivalence relation) 是 一 种 特殊 类 型 的 二 元 关系 ， 它 利用 了 通过 某 种 特 
征 把 两 个 对 象 等 同 起 来 的 想法 。 如 果 二 元 关系 R 满足 以 下 3 个 条 件 : 

1.R 是 自 反 的 (reflexive)， 即 对 每 一 个 x，ZxRX。 

2. R 是 对 称 的 (symmetric)， 即 对 每 一 个 x 和 y，xzRy 意味 着 yRrz 。 

3. R 是 传递 的 (transitive)， 即 对 每 一 个 x+，y 和 zz，xRy 和 yRz 意味 着 Rz. 

则 称 R 为 一 个 等 价 关系 。 

定义 一 个 自然 数 集 上 的 等 价 关系 二 +。 对 于 i，jEN， 如 果 i 一 j 是 7 的 倍数 ， 
则 说 i 三 7;} 。 这 是 一 个 等 价 关 系 ， 因 为 它 满足 上 述 的 3 个 条 件 。 首 先 ， 它 是 自 反 的 ， 因 为 i 
一 j 二 0 是 7 的 倍数 。 其 次 ， 它 是 对 称 的 ， 因 为 若 j 一 i 是 7 的 倍数 ， 则 ;一 7 也 是 7 的 倍数 。 
再 者 ， 它 是 传递 的 ， 因 为 只 要 i 一 ; 是 7 的 倍数 且 jk 是 7 的 倍数 ， 那 么 ;一 &= (一 7 十 


G—k) 是 两 个 7 的 倍数 之 和 ， 从 而 也 是 7 的 倍数 。 a 
0.2.4 图 
无 向 图 (undirected graph) 简称 为 图 (graph), (2 


是 由 一 个 点 的 集合 以 及 连接 其 中 某 些 点 的 线段 组 成 Q T 
的 。 这 些 点 称 为 结 点 (node) 或 顶点 (vertex), NL 


线段 称 为 边 (edge)， 如 图 0- 5 所 示 。 PA 
顶点 的 度 (degree) 是 以 这 个 顶点 为 端点 的 边 © B 





的 数目 。 在 图 0-5 (a) 中 所 有 顶点 的 度 都 为 2。 在 
图 0-5 (b) 中 所 有 顶点 的 度 都 为 3。 任何 两 个 顶点 图 0-5 图 的 例子 
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之 间 至 多 有 一 条 边 。 在 菜 些 情况 下 ， 人 允许 图 中 含有 始点 和 终点 相同 的 边 ， 并 称 其 为 自 环 
(self-loop) 。 

设 图 G 包含 项 点 i 和 顶点 了 ARM Gp) 表示 连接 i 和 j 的 边 。 在 无 向 图 中 不 考虑 i 
和 j 的 顺序 ， 因 此 有 序 对 Gj 和 “(j,i) 表示 同一 条 边 。 由 于 顶点 的 顺序 是 无 关 紧 要 的 ， 
所 以 有 时 用 二 元 集合 来 表示 无 向 边 ， 写 为 ij) WR G 的 顶点 集 为 V、 边 集 为 正 ， 则 记 为 
G 二 (V,E)。 可 以 用 一 个 图 形 或 更 形式 化 地 指定 V 和 上 来 描述 一 个 图 。 例 如 ， 图 0- 5(Ca) 中 
图 的 形式 化 描述 为 

CUD et ho) 00128) Sb a dt 107) 
图 0-5 (b) 中 图 的 形式 化 描述 为 
i x hra y€2 0) x AAA rhb 4) 1D 

通常 可 用 图 表示 数据 。 例 如 : 顶点 为 城市 、 边 为 连接 城市 的 高 速 公 路 ， 或 者 顶点 为 
人 、 边 为 连接 他 们 的 友情 。 有 时 为 了 方便 ， 给 图 的 顶点 或 边 作 标记 ， 这 样 的 图 称 作 标定 图 
(labeled graph). KI 0-6 画 出 一 张 图 ， 它 的 顶点 为 城市 。 如 果 两 个 城市 之 间 有 直达 航班 ， 
则 它们 之 间 有 一 条 边 ， 并 且 标 上 直达 飞行 的 最 低 票 价 (美元 )。 

如 果 图 G 的 顶点 集 为 图 互 的 顶点 集 的 子 集 ， 则 称 G 为 互 的 子 图 (subgraph)。 如 图 
0-7 htm, 的 边 均 为 互 在 对 应 项 点 上 的 边 。 图 0- 7 表示 图 HAFAG. 






图 万 OQ 
子 图 C 
ae ( 粗 黑 线 部 分 
KS 
图 0-6 城市 之 间 直 达 飞 行 的 最 低 票 价 图 0-7 ALG ( 粗 黑 线 部 分 ) 是 五 的 子 图 


图 中 的 路 径 (path) 是 由 边 连接 的 顶点 序列 。 简 单 路 径 (simple path) 是 没有 顶点 重 
复 的 路 径 。 如 果 每 一 对 顶点 之 间 都 有 一 条 路 径 ， 则 称 这 个 图 为 连通 图 (connected graph). 
如 果 一 条 路 径 的 起 点 和 终点 相同 ， 则 称 这 个 图 为 一 个 圈 (cycle)。 如 果 一 个 圈 包 含 至 少 3 
个 顶点， 并 且 除 起 点 和 终点 之 外 没有 顶点 重复 ， 则 称 它 是 一 个 简单 圈 (simple cycle) 。 树 
(tre) 是 连通 且 没 有 简单 圈 的 图 ， 如 图 0-8 所 示 。 有 时 专门 指定 树 的 一 个 顶点 ， 把 它 称 为 
这 棵 树 的 根 (root) 。 一 棵 树 中 度数 为 1 的 顶点 称 为 这 棵 树 的 树叶 deaf). 





图 0-8 (a) 图 中 的 一 条 路 径 ，(b) 图 中 的 一 个 圈 ，(c) 一 棵 树 


在 有 向 图 (directed graph) 中 线段 被 箭头 所 蔡 换 ， 如 图 0-9 所 示 。 从 一 个 顶点 引出 的 
箭头 数 为 这 个 顶点 的 出 度 (outdegree)， 指 向 一 个 顶点 的 
第 头 数 为 这 个 顶点 的 入 度 Cindegree) 。 

在 有 向 图 中 ， 用 有 序 对 Gj) 表示 从 i 到 ;7 的 边 。 
有 向 图 G 的 形式 化 描述 为 (V,E)， 其 中 V AMAR, E 
为 边 集 。 图 0- 9 中 表示 的 有 向 图 的 形式 化 描述 为 

EAEAP IMLAR REANA ST 

(5,4),(5,6) C61) C6.3)}) Bos Tar Ae 

所 有 箭头 的 方向 都 与 其 前 进 的 方 加 一致 的 路 径 称 为 有 向 路 径 〈directed path), WARM 
每 一 个 顶点 到 另 一 个 顶点 都 有 一 条 有 回路 径 ， 则 称 这 个 有 辐 图 为 强 连 通 图 (strongly con- 
nected graph)。 有 癌 图 是 描述 二 元 关系 的 便利 方式 。 设 R 为 一 个 二 元 关系 ， 它 的 定义 域 为 
DXD， 则 标定 图 G=(D,E) 表示 R， 其 中 E={(x,y)|xRy})。 

ete ERA 0.6 中 给 出 的 关系 的 有 疝 图 如 图 0- 10 所 示 。 a 








图 0- 10 表示 打败 关系 的 有 向 图 
0.2.5 字符 串 和 语言 


字符 串 是 计算 机 科学 的 重要 基础 之 一 。 根 据 应 用 的 要 求 ， 可 以 在 各 种 各 样 的 字母 表 上 
定义 这 样 的 字符 串 。 按 照 要 求 ， 定 义 字 母 表 (alphabet) 为 任意 一 个 非 空 有 穷 集合 。 字 和 母 
表 的 成 员 为 该 字母 表 的 符号 (symbol). WHAKS HSE > ME 表示 字母 表 和 字母 表 
中 符号 的 打印 字体 。 下 面 是 几 个 字母 表 的 例子 。 

Zi= i01} 
Bea be tod sof fh taf oR od ps igs PrO? 9S php EL 
r={0,1,2,y52} 

字母 表 上 的 字符 串 (string over an alphabet) HAFHRRPHSHNABPI, HRS 
为 一 个 符号 挨 着 一 个 符号 ， 不 用 逗号 隔 开 。 设 丈 = 王 (0,1)， 则 01001 As, 上 的 一 个 字符 
串 。 设 2 一 {a,b,c,…,z) 则 abracadabra 为 32 上 的 一 个 字符 串 。 设 世 为 三 上 的 一 个 字符 
P, wit (length 等 于 它 所 包含 的 符号 数 ， 记 作 | wl. KEEN SH PUES 
串 (empty string) ， 记 为 s。 空 串 起 的 作用 就 像 0 在 数 系 中 的 作用 一 样 。 如 果 w 的 长 度 为 
n， 则 可 以 写 为 ww 二 wiw2…wn， 这 里 每 一 个 weds. w HIRE (reverse) 是 按照 相反 的 顺 
序 写 w 所 得 到 的 字符 串 ， 记 作 we, B uS ww i wo. WRF E z 连续 地 出 现在 ww 
H, ME z 为 w OTB (substring)。 例 如 ，cad 为 abracadabra 的 子 串 。 

设 工 是 长 度 为 m 的 字符 串 ，y EKEK n WFR, z 和 y 的 连接 (concatenation) 
是 把 y 附加 在 xz 的 后 面 得 到 的 字符 串 ， 记 为 zy， 即 zy 一 Zi…Zznyl…yn。 可 采用 上 标 表示 
法 表示 一 个 字符 串 自 身 连 接 多 次 ， 例 如 x* 表示 


eS 


noua te 

字符 串 的 字典 序 (lexicographic order) 和 大 家 熟悉 的 字典 顺序 一 样 。 通 常 ， 我 们 采用 
字符 串 顺 序 (shortlex order 或 string order) ， 它 在 字典 序 基 础 上 将 短 的 字符 串 排 在 长 的 字 
符 串 的 前 面 。 例 如 ， 字 母 表 (0, 1) 上 的 所 有 字符 串 的 字符 串 顺 序 为 Ce,0,1,00,01,11, 
000，… ) 。 

字符 串 zx 是 字符 串 y WAR 〈prefix) ， 如 果 存 在 字符 串 z 满足 zz 一 y， 并 且 若 Hy, 
则 z 称 为 y SAAB (proper prefix) 。 字 符 串 的 集合 称 为 语言 (language) 。 如 果 语 言 中 
任何 一 个 成 员 都 不 是 其 他 成 员 的 真 前 级 ， 那 么 该 语言 是 无 前 缀 的 (prefix-free)。 


0.2.6 布尔 逻辑 


布尔 逻辑 (Boolean logic) 是 建立 在 TRUE fl FALSE 两 个 值 上 的 代数 系统 。 这 个 系 
统 最 初 是 作为 纯 数学 构想 提出 来 的 ， 现 在 被 公认 为 是 数字 电子 学 和 计算 机 设计 的 基础 。 值 
TRUE 和 值 FALSE 被 称 为 布尔 值 〈(Boolean value) ， 并 且 经 常用 值 1 和 值 0 表示。 在 有 两 
种 可 能 的 时 候 使 用 布尔 值 ， 例 如 一 条 电路 可 能 处 于 高 电位 或 低 电 位 ， 一 个 命题 可 能 是 真 或 
假 ， 对 一 个 问题 的 回答 可 能 为 是 或 否 。 

可 以 用 布尔 运算 (Boolean operation) 人 处理 布 尔 值 。 最 简单 的 布尔 运算 为 非 (negation) 
或 NOT 运算 ， 用 符号 “一 ”表示 。 一 个 布尔 值 的 非 为 与 它 相 反 的 值 ， 即 一 0 二 1, 一 1 二 0。 合 
取 (conjunction) 或 AND 运算 的 符号 为 “人 ”。 仅 当 两 个 布尔 值 都 为 1 时 ， 它 们 的 合 取 为 
1。 析 取 (disjunction) 或 OR 运算 的 符号 为 “V”。 当 两 个 布尔 值 中 有 一 个 为 1 时 ， 它 们 
的 析 取 为 1。 下 面 综 合 列 出 上 述 运算 的 定义 : 


AD 一 0 0 y 0=0 “gal 
0A 1=0 OV1=1 = 
LAO=0 1y 0=1 
1A1=] LYUSI] 


使 用 布尔 运算 可 以 把 简单 的 命题 组 合成 更 复杂 的 布尔 表达 式 ， 就 像 使 用 算术 运算 十 和 
X 构 造 复 杂 的 算术 表达 式 一 样 。 例 如 ， 设 PP 是 表示 命题 “现在 天 气 晴朗 ”的 真 假 值 的 布尔 
值 ，Q 是 表示 命题 “今天 是 星期 一 ”的 真 假 值 的 布尔 值 ， 那么 可 以 用 PQ 表示 命题 “ 现 
在 天 气 晴朗 并 且 今 天 是 星期 一 ”的 真 假 值 。 对 于 PV Q, 与 此 类 似 ， 只 需 把 “并 且 ” 换 成 
“WE” o E P 和 Q 称 为 该 运算 的 运算 对 象 (operand). 

偶尔 会 用 到 另外 几 个 布尔 运算 。 异 或 (exclusive or) 运算 (或 者 XOR 运算 ) 的 符号 
为 “中 ”， 当 它 的 两 个 运算 对 象 中 一 个 为 1、 男 一 个 为 0 时 其 值 为 1。 等 值 (equality) 运算 
的 符号 是 “<*>”， 当 它 的 两 个 运算 对 象 取 值 相同 时 其 值 为 1。 最 后 ， 蕴 涵 (implication) 运 
算 的 符号 是 “一 ”， 并 且 当 它 的 第 一 个 运算 对 象 为 1、 第 二 个 运算 对 象 为 0 时 其 值 为 0; 否 
则 为 1。 下 面 综 合 列 出 这 些 定 义 : 


0®0=0 0<0=—1 O-=)=] 
0 中 1 三 1 Ge [= O->] =] 
1@0=1 1<0=0 1-*0=0 
1@1=0 leo l= lJ-»]1=] 


可 以 给 出 这 些 运 算 之 间 的 各 种 关系 。 实 际 上 ， 能 用 AND 与 NOT 运算 来 表示 所 有 的 
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布尔 运算 ， 如 下 面 的 式 子 所 示 。 每 一 行 的 两 个 表达 式 是 等 价 的 。 每 一 行 用 它 上 面 的 运算 及 
AND、NOT 表示 左边 一 列 的 运算 。 


FYQ a(7 PA7Q) 
P—>Q "F YG 

PQ (P= A(Q>P) 
POQ (PQ) 


有 关 AND 5 OR 的 分 配 律 (distributive law) 在 处 理 布尔 表达 式 时 会 有 用 。 它 很 像 有 
关 加 法 与 乘法 的 分 配 律 aX (5 十 c)= 二 (aX6b) 十 (aXc)。 布尔 分 配 律 有 以 下 两 种 形式 ， 


© PACQVR)SF(PAQV(PAR) 
© PV(QAR)SF(PVQ) 人 (PVR) 


0.2.7 数学 名 词汇 总 


字母 表 符号 对 象 的 有 穷 集 合 。 

自 变量 PK aC AY A. o 

二 元 关系 定义 域 为 有 序 对 集合 的 关系 。 

布尔 运算 布尔 值 的 运算 。 

布尔 值 值 TRUE 或 值 FALSE， 常 用 1 或 0 表示 。 

笛 卡 儿 积 对 多 个 集合 的 运算 ， 用 分 别 来 自 这 些 集 合 的 元 素 的 所 有 多 元 组 构成 一 
ane: ae 

补 对 一 个 集合 的 运算 ， 用 不 在 这 个 集合 中 的 所 有 元 素 构成 一 个 集合 。 

连接 把 多 个 字符 串 连 接 在 一 起 的 运算 。 

合 布尔 运算 AND。 

连通 图 每 一 对 顶点 都 有 路 径 相 连 的 图 。 

al 起 止 在 同一 个 顶点 的 路 径 。 

有 向 图 顶点 和 连接 某 些 顶点 的 箭头 构成 的 集合 。 

析 取 布尔 运算 OR. 

定义 域 函数 所 有 可 能 的 输入 构成 的 集合 。 

边 图 中 的 一 条 线段 。 

元 素 集合 中 的 一 个 对 象 。 

空 集 没有 任何 元 素 的 集合 。 

= 长 度 为 零 的 字符 串 。 

等 价 关 系 目 反 、 对 称 和 传递 的 二 元 关系 。 

函数 把 输入 转变 成 输出 的 运算 。 

图 顶点 和 连接 某 些 顶点 的 线段 构成 的 集合 。 

交 对 多 个 集合 的 运算 ， 用 这 几 个 集合 的 共同 元 素 构成 一 个 集合 。 

k 元 组 一 列 & 个 对 象 。 

语言 字符 串 的 集合 。 

成 员 集合 中 的 一 个 对 象 。 

结 点 图 中 的 一 个 点 。 

有 序 对 一 对 有 序 的 元 素 。 


路 径 图 中 用 边 连接 起 来 的 项 点 序列 。 
谓词 以 { TRUE, FALSE} A/a aN AX. 
性 质 — “S48 1] s 
值 域 一 个 集合 ， 函 数 的 输出 都 取 自 这 个 集合 。 
关系 一 个 谓词 ， 最 典型 地 ， 其 定义 域 为 & 元 组 集合 。 
序列 排列 成 一 列 的 对 象 。 
合 一 组 对 象 。 


简单 路 径 顶点 不 重复 的 路 径 。 
单元 素 集 合 。 只 有 一 个 成 员 的 集合 。 


FITR 取 上 自 一 个 字母 表 的 一 列 有 穷 个 符号 。 

符号 字母 表 的 一 个 成 员 。 

树 不 含 简单 圈 的 连通 图 。 

并 对 多 个 集合 的 运算 ， 把 这 几 个 集合 中 的 所 有 元 素 合 并 成 一 个 集合 。 
二 元 集合 含有 两 个 成 员 的 集合 。 

顶点 图 中 的 一 个 后 。 


0.3 定义 、 定 理 和 证 明 


定理 和 证 明 是 数学 的 精 艇 ， 而 定义 是 数学 的 灵魂 。 这 三 部 分 是 包括 本 科目 在 内 的 每 个 
数学 科目 的 核心 。 

定义 〈definition) 描述 了 我 们 使 用 的 对 象 和 概念 。 和 定义 可 能 是 简单 的 ， 如 本 章 已 给 出 
的 集合 的 定义 ; 也 可 能 是 复杂 的 ， 如 密码 系统 中 对 安全 的 定义 。 任 何 数学 定义 都 必须 是 精 
确 的 。 当 定义 一 个 对 象 时 ， 必 须 弄 清楚 什么 构成 这 个 对 象 、 什 么 不 构成 这 个 对 象 。 

在 定义 各 种 对 象 和 概念 之 后 ， 通 常 要 给 出 关于 它们 的 数学 命题 (mathematical state- 
ment)。 典 型 情况 下 ， 一 个 命题 描述 某 个 对 象 具有 某 种 性 质 。 命 题 可 能 为 真 ， 也 可 能 为 假 ， 
但 和 定义 一 样 必须 是 精确 的 。 它 的 含义 不 能 有 任何 模棱两可 的 地 方 。 

WEAR (proof) 是 一 种 逻辑 论证 ， 它 使 人 们 确信 一 个 命题 为 真 。 在 数学 中 ， 一 个 论证 
必须 无 懈 可 击 的 ， 也 就 是 说 ， 论 证 要 使 人 绝对 信服 。 它 和 我 们 在 日 常生 活 中 或 在 法 律 上 使 
用 的 证 据 这 一 概念 有 很 大 的 区 别 。 在 谋杀 案 审 判 中 要 求 存 在 “没有 任何 合理 疑点 ”的 证 
据 。 重 要 的 证 据 可 能 迫使 陪审 团 接 受 疑 犯 无 罪 或 有 罪 的 辩护 。 但 是 ， 这 种 证 据 在 数学 证 明 
中 不 起 作用 。 数 学 家 需要 没有 任何 疑点 的 证 明 。 

定理 (theorem) 是 被 证 明 为 真 的 数学 命题 。 通 常 只 对 特别 感 兴趣 的 命题 使 用 这 个 词 。 
有 时 ， 有 兴趣 证 明 某 些 命 题 只 是 因为 它们 有 助 于 证 明 另 一 个 更 有 意义 的 命题 ， 这 样 的 命题 
称 为 引 理 〈lemma) 。 有 时 ， 一 个 定理 或 其 证 明 可 以 使 我 们 容易 得 出 另外 一 些 有 关 的 命题 
为 真 的 结论 ， 这 些 命题 称 为 这 个 定理 的 推论 (corollary)。 


寻找 证 明 


给 出 数学 证 明 是 确定 一 个 数学 命题 为 真 或 假 的 唯一 方法 。 可 是 ， 找 到 数学 证 明 并 不 总 
是 容易 的 事情 。 不 可 能 把 它 简化 为 一 组 简单 的 规则 或 过 程 。 在 本 书 中 ， 我 们 要 求 给 出 各 种 
APA NUE. TARR VE! 因为 虽然 没有 任何 人 有 制造 证 明 的 诀 窜 ， 但 是 我 们 可 以 利用 一 
些 有 用 的 普遍 性 策略 。 


首先 ， 要 仔细 地 看 清楚 要 证 明 的 命题 。 是 否 理解 命题 的 所 有 记号 ” 先 用 自己 的 语言 
命题 重 写 一 遍 。 把 它 拆 开 并 且 分 别 考 虑 每 一 部 分 。 

有 时 候 由 者 干部 分 组 成 的 命题 的 各 个 部 分 并 不 都 是 明显 的 。 这 种 命题 经 常 出 现 的 一 种 
形式 是 “了 的 充分 必要 条 件 是 Q”， 其 中 已 和 Q 为 两 个 数学 命题 。 这 种 写法 是 对 一 个 由 两 
部 分 组 成 的 命题 的 缩写 。 第 一 部 分 是 “P 仅 当 Q”， 它 的 意思 为 : EPH, MQW, 
写成 PQ。 第 二 部 分 是 “P 当 Q”， 它 的 意思 为 : 若 Q 为 真 ， 则 了 为 真 ， 写 成 P<Q。 第 
一 部 分 是 原 命 题 的 向 前 方向 (forward direction)， 第 二 部 分 是 反方 向 (reverse direction), 
E “P 的 充分 必要 条 件 是 Q” 写 成 P 今 Q。 要 证 明 这 种 形式 的 命题 ， 必 须 证 明 这 两 个 方 癌 
中 的 每 一 种 情况 。 通 第 情况 下 ， 这 两 个 方向 中 一 个 比 另 一 个 容易 证 明 。 

这 种 命题 的 男 一 种 类 型 是 陈述 两 个 相等 的 集合 A 和 B。 它 的 第 一 部 分 说 明和 A 是 B 的 
子 集 ， 第 二 部 分 说 明 B 是 A MTR. MA, 证明 A=B 的 通用 方法 : 证 明 A 的 每 一 个 元 
素 也 为 B 的 元 素 ， 以 及 B 的 每 一 个 元 素 也 为 A 的 元 素 。 

其 次 ， 当 想 证 明 一 个 命题 或 它 的 一 部 分 时 ， 要 尽 可 能 证 明 它 为 什么 应 该 为 真 。 在 证 明 
<W m ESEA ETEA 10. RAEE 
一 种 特定 的 性 质 ， 那 么 取 几 个 这 种 类 型 的 对 象 并 且 观 察 它 们 确实 具有 这 种 性 质 。 这 样 做 之 
后 ， 再 试 试 找 一 个 不 具有 这 种 性 质 的 对 象 ， 这 样 的 对 象 称 为 反例 〈counterexample) 。 如 果 
命题 确实 为 真 ， 就 不 可 能 找到 反例 。 当 试图 找 反例 时 看 看 在 什么 地 方 遇 到 了 困难 ， 这 能 够 
| 

假设 要 证 明 命题 ， 对 于 每 一 个 图 G，G 中 所 有 顶点 度数 之 和 为 偶数 ， 

ep 画 几 个 图 ， 观 察 这 个 命题 的 实际 情况 。 图 0- 11 是 两 个 例子 。 


然后 ， 去 找 反 例 ， 即 顶点 度数 之 和 为 奇数 的 图 。 发 现 每 增加 一 条 边 ， 度 数 之 和 增加 2。 
见 图 0-12。 


2 aF 
ra” raves 
顶点 度数 之 和 顶点 度数 之 和 
一 2+2+2 一 0 一 2+3+4+3+2 一 14 
图 0-11 两 个 例子 图 0-12 每 次 增加 一 条 边 ， 和 增加 2 
现在 ， 你 能 开始 看 出 命题 为 什么 为 真 和 怎样 证 明 它 了 吧 ? € 


如 果 仍 然 不 能 直接 证 明 这 个 命题 ， 那 么 试 试 证 明 容 易 一 点 的 事情 ， 即 去 证 明 这 个 命题 
的 一 种 特殊 情况 。 例 如 ， 如 有 果 要 证 明 对 于 每 一 个 & 之 0， 某 个 性 质 为 真 ， 先 去 证 明 对 于 k= 
1 它 为 真 。 如 果 成 功 了 ， 再 去 证 明 对 于 k= 等 等 它 为 真 ， 直 到 能 够 证 明 更 一 般 的 情况 。 如 
果 一 种 特殊 情况 是 难 证 明 的 ， 那 么 去 试 试 证 明 另 一 个 不 同 的 特殊 情况 ， 或 者 还 可 能 是 这 个 
特殊 情况 的 特殊 情况 。 

最 后 ， 当 确信 已 经 找到 证 明 的 时 候 ， 必 须 将 它 严 格 地 书写 出 来 。 一 个 写 得 很 好 的 证 明 
是 一 系列 的 形式 化 描述 ， 其 中 每 一 条 语句 都 由 前 面 的 语句 经 过 简单 的 推理 得 到 。 仔 细 书 写 
证 明 非 常 重要 ， 这 样 既 能 够 让 读者 理解 它 ， 又 能 够 保证 它 正确 无 误 。 

以 下 是 关于 构造 证 明 的 几 点 建议 : 

。 要 有 耐心。 寻找 证 明 需 要 时 间 。 如 有 果 没 有 马上 看 出 怎么 着 手 证 明 ， 也 不 必 烦 恼 。 


为 了 找到 一 个 合适 的 证 明 ， 研 究 人 员 有 时 要 工作 数 周 甚至 数 年 。 
。 回头 做 。 看 一 遍 要 证 明 的 命题 ， 考 虑 一 会 儿 ， 然 后 放下 它 ， 过 一 小 段 时 间 之 后 再 
回 到 这 个 问题 上 来 。 让 你 内 心 的 潜意识 和 直觉 有 机 会 起 作用 。 
© 条例 清 晰 。 当 对 要 证 明 的 命题 进行 直觉 分 析 时 ， 请 使 用 简单 明了 的 图 形 或 文字 描 
述 ， 也 可 以 两 者 同时 使 用 。 当 你 正在 深入 研究 这 个 命题 时 ， 杂 乱 无 章 会 妨碍 深入 
研究 。 此 外 ， 把 一 个 结果 写 给 别人 看 ， 清 晰 的 表述 有 助 于 别人 理解 。 
。 表达 简洁 。 简 洁 有 助 于 表达 高 层次 的 思想 而 不 丧失 细节 。 好 的 数学 表示 法 有 利于 
简明 地 表达 思想 。 但 是 ， 在 写 证 明 的 时 候 必 须 充分 地 写 出 你 的 推理 ， 让 读者 能 够 
容易 理解 所 证 明 的 东西 。 
为 了 说 明 具 体 的 做 法 ， 让 我 们 以 证 明 德 。 摩 根 律 之 一 为 例 。 
GEED 对 于 任意 两 个 集合 A HB, AUB=ANB. 
首先 ， 要 搞 清 楚 这 个 定理 的 意思 。 如 果 不 知 道 符号 U 、 门 或 上 横 线 的 意思 ， 请 复习 前 
面 (0.2.177) MWA. 

为 了 证 明 这 个 定理 ， 必 须 证 明 两 个 集合 AU B 与 A 门 B 相 等 。 前 面 讲 过 ， 可 以 通过 证 明 
一 个 集合 的 每 一 个 元 素 也 是 另 一 个 集合 的 元 素 和 反之 亦 真 来 证 明 两 个 集合 是 相等 的 。 在 看 
下 面 的 证 明之 前 ， 请 先 考虑 几 个 例子 ， 自 己 试 试 去 证 明 它 。 

证 明 ”这 个 定理 称 两 个 集合 AU B 与 A 门 B 相 等 。 通 常 证 明 如 下 ， 通 过 说 明 一 个 集合 的 
每 一 个 元 素 也 是 另 一 个 集合 的 元 素 并 且 反之 亦 真 来 证 明 这 个 断言 。 

假设 r 是 A U B 的 一 个 元 素 ， 那 么 ， 由 集合 的 补 集 的 定义 可 知 ，z 不 在 集合 AUB 中 。 
故 由 两 个 集合 的 并 集 的 定义 可 知 ，z 不 在 集合 A PHI 不 在 集合 B 中 。 亦 即 ，z 在 集合 A 
中 且 z 在 集合 B 中 。 因 此 ， 根 据 两 个 集合 的 交集 的 定义 ，x ERAANBH. 

反之 亦 然 ， 假 设 x 在 集合 A 站 mB +, WA, 既 在 集合 A 中 、 又 在 集合 中。 因此， 
zx 就 不 在 集合 A PH ae 不 在 集合 B 中 ， 亦 即 不 在 这 两 个 集合 的 并 集中 。 所 以 ，z 在 这 两 个 
集合 的 并 集 的 补 集中 ， 即 是 说 ，z 在 集合 A UB 中 。 该 定理 的 证 明 完 毕 。 sa 

现在 证 明 例 0. 9 中 的 命题 。 

直下 [天 路 在 任意 一 个 图 G 中 ，G 的 所 有 顶点 度数 之 和 为 偶数 。 

证 明 G 中 对 每 一 条 边 连 接 两 个 顶点 ， 每 一 条 边 对 连接 它 的 每 一 个 顶点 贡献 的 度数 是 

1。 故 每 一 条 边 对 所 有 顶点 贡献 的 度数 之 和 为 2。 所以， 如 果 G 包含 e 条 边 ， 则 G 的 所 有 
顶点 度数 之 和 等 于 2e， 这 是 一 个 偶数 。 æ 


0.4 证 明 的 类 型 


在 数学 证 明 中 通常 会 出 现 多 种 类 型 的 论证 。 我 们 在 这 里 描述 几 种 在 计算 理论 中 常用 的 
类 型 。 因 为 一 个 证 明 可 以 分 成 知 干 不 同 部 分 ， 每 一 部 分 也 是 一 个 证 明 ， 所 以 请 注意 ， 一 个 
证 明 可 以 包含 一 种 以 上 的 论证 类 型 。 








0.4.1 构造 性 证 明 


许多 定理 声明 存在 一 种 特定 类 型 的 对 象 。 通 过 说 明 如 何 构 造 这 样 的 对 象 是 证 明 这 种 定 
理 的 一 种 方法 ， 这 种 方法 就 是 构造 性 证 明 (proof by construction), 
现 采 用 构造 性 证 明 方 法 证 明 以 下 定理 。 我 们 定义 : 如 果 图 中 每 一 个 顶点 的 度数 都 为 上 ， 
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则 称 这 个 图 是 上 正则 的 (ek regular). 

GERD 对 于 年 一 个 大 于 2 的 偶数 mn， 存 在 一 个 有 郊 个 顶点 的 3 ENA. 

证 明 hn BAF 2 的 偶数 。 现 构造 有 ?个 顶点 的 图 G=(V,E)，G 的 顶点 集 为 V= 
{0,1,…,n 一 1} ， 边 集 为 

E=({i,it1} | 0<i<n—2}U ({n—1,0}} U ({i,i+n/2} | OSi<n/2—-1} 

现在 沿 着 一 个 圆 的 圆周 顺序 画 出 这 个 图 的 所 有 顶点 。E 等 号 右边 的 上 一 行 描述 的 边 连 接 圆 
周 上 相 邻 的 一 对 顶点 ， 下 一 行 描述 的 边 连 接 一 个 顶点 与 它 对 面 的 项 点。 这 个 想象 的 图 清楚 
地 表明 G 的 每 一 个 顶点 的 度数 为 3。 故 按照 上 面 的 定义 ， 证 得 该 命题 为 真 。 


0.4.2 反 证 法 


另 一 种 常用 的 证 明定 理 的 论证 方法 是 ， 假 设 这 个 定理 为 假 ， 然 后 证 明 这 个 假设 会 导致 
一 个 明显 的 错误 结论 ， 故 而 相 矛 盾 。 在 现实 生活 中 经 常 使 用 这 种 类 型 的 推理 。 现 举例 
如 下 。 
GEER “AHALE ( 女 ) 刚 从 外 面 进 来 时 ， 发 现 她 全 身 衣 服 是 干 的 ， 因 此 他 
推理 现在 没有 下 雨 ， 他 对 现在 没有 下 雨 的 “证 明 ” 是 这 样 推 理 的 ， 如 果 现 在 外 面 在 下 雨 
(假设 命题 为 假 )， 吉 尔 身上 的 衣服 应 该 是 湿 的 (一 个 明显 的 错误 结论 )。 所 以 得 出 推论 : 
现在 外 面 一 定 没有 下 雨 。 x 

下 面 我 们 采用 反 证 法 证 明 命题 : 2 的 平方 根 为 无 理 数 。 如 果 一 个 数 是 一 个 分 式 m/n, 
Hm 和 nn 是 整数 ， 则 这 个 数 是 有 理 数 (rational number) 。 换 言 之 ， 一 个 有 理 数 是 整数 
mAln 的 比值 。 例 如 2/3 显然 是 一 个 有 理 数 。 如 果 一 个 数 不 是 有 理 数 ， 则 它 为 无 理 数 


(irrational number) 。 


SED V2 是 元 理 效 。 
证 明 ”为 了 得 到 矛盾 的 结论 ， 假 设 V2 是 有 理 数 。 于 是 


此 处 m 和 n 都 是 整数 。 如 果 m An 都 能 被 同一 个 大 于 1 的 最 大 整数 除 尽 ， 则 用 那个 整数 
除 它 们 ， 不 会 改变 分 式 的 值 。 故 ，m 和 不 可 能 均 为 偶数 。 
MH ” 乘 等 式 的 两 边 ， 得 到 
ny2 =m 
再 对 两 边 同 时 平方 ， 得 到 


由 于 m? 是 整数 n? 的 2 倍 ， 故 m? 是 偶数 。 所 以 m 也 是 偶数 ， 因 为 已 知 奇数 的 平方 总 是 奇 
数 。 因 而 ， 对 于 某 个 整数 k，m 二 2k， 于 是 ， 我 们 用 2k Rm 带 人 上 式 ， 得 到 
2n? = (2k)? =4k? 
对 等 式 两 边 同 时 除 以 2， 得 到 
n? = 2k? 
而 这 个 结果 表明 n 是 偶数 ， 从 而 是 偶数 。 于 是 ，m 和 nn 都 是 偶数 。 但 是 ， 前 面 已 经 化 
简 和 ?2， 使 它们 不 会 都 是 偶数 ， 故 相 矛 盾 。 所 以 ，V2 为 无 理 数 。 a 
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0.4.3 归纳 法 


归纳 法 是 证 明 无 穷 集合 的 所 有 元 素 具 有 某 种 特定 性 质 的 高 级 方法 。 例 如 ， 我 们 可 以 采 
用 归纳 法 证 明 ， 一 个 算术 表达 式 对 于 它 的 变量 的 每 一 组 赋值 都 能 够 计算 出 它 想 要 得 到 的 
值 ， 或 证 明 一 个 程序 在 每 一 步 或 对 所 有 的 输入 都 能 够 得 到 正确 的 结果 。 

为 了 描述 如 何 使 用 归纳 法 ， 我 们 把 无 穷 集 合 取 为 自然 数 集 N= 二 {1,2,3,…})， 而 把 该 性 
质 称 为 刀 。 现 在 要 证 明 对 于 每 个 自然 数 &，P(C&) 为 真 。 换 言 之 ， 即 要 证 明 P(1) WH, 
以 及 P(2)，P(3)，P(4) 等 等 均 为 真 。 

每 一 个 归纳 证 明 均 由 两 部 分 组 成 : 归纳 基础 Chasis) 和 归纳 步骤 (induction step), 
每 部 分 自身 为 一 个 单独 的 证 明 。 归 纳 基础 证 明 P(1) 为 真 。 而 归纳 步骤 证 明 : 对 于 每 一 个 
i 之 1， 如 果 P(i) 为 真 ， 则 P(i 十 1) 也 为 真 。 

只 要 我 们 完成 了 这 两 部 分 的 证 明 ， 就 能 得 到 命题 的 结果 : 即 对 于 每 一 个 i，P(i) 为 
真 。 为 什么 呢 ? 第 一 步 ， 证 明 PO) 为 真 ， 因 为 归纳 基础 已 经 单独 证 明 它 了 。 第 二 步 ， 通 
过 归纳 步骤 证 明 : 如 果 PU) EMPH 为 真 ， 而 前 面 已 经 证 明了 Pd) XE, MA 
PQO) 也 为 真 。 第 三 步 ， 再 通过 归纳 步骤 证 明 : WR POO 为 真 则 POD 为 真 ， 而 前 面 也 
已 经 证 明了 PO AR, MU P(3) 也 为 真 。 将 这 种 过 程 对 所 有 的 自然 数 继续 证 明 下 去 ， 
会 发 现 P(4) 为 真 ，P(5) 为 真 ， 等 等 。 

一 旦 理解 了 这 种 证 明 的 思路 ， 就 能 够 很 快 理解 这 种 证 法 的 变种 或 推广 。 例 如 ， 归 纳 基 
础 不 必 一 定 从 1 开始， 也 可 以 从 任意 的 值 b 开始 。 这 样 归纳 法 证 明 对 于 每 一 个 三 3»，P(k) 
均 为 真 。 

在 归纳 步骤 的 证 明 中 ， 对 假设 PG) 为 真 称 为 归纳 假设 (induction hypothesis). {Rix 
对 于 每 一 个 ] 二 i，P(j) 为 真是 一 种 更 强 的 归纳 假设 ， 有 时 这 种 更 强 的 归纳 假设 在 证 明 中 
很 有 用 。 现 在 对 归纳 证 明 照 样 进行 下 去 ， 因 为 当 想 要 证 明 P(iz 十 1) ARM, 我们 已 经 证 
明 对 于 每 一 个 ji PG) AH. 

理解 这 种 证 明 方法 后 ， 现 将 归纳 证 明 的 格式 书写 如 下 : 

归纳 基础 ”证明 PCL) WE. 


归纳 步骤 MFR-Pi>l, 假设 PO) 为 真 ， 并 且 利 用 这 个 假设 去 进一步 证 明 
EL AH. 


现在 采用 归纳 法 来 证 明 房 产 抵押 贫 球 的 月 付款 计算 公式 的 正确 性 。 很 多 人 借 钱 买房 子 
并 且 在 春 干 年 内 应 偿还 这 笔 贷 款 。 如 果 要 求 在 30 年 内 还 清 贷款 ， 典 型 的 方法 是 ， 在 还 贷 
条 球 中 规定 每 个 月 支付 固定 偿还 款额 ， 其 中 应 包括 利息 以 及 部 分 原 贷款 金额 。 计 算 月 付款 
钱 数 的 公式 看 起 来 神秘 ， 其 实 十 分 简单 。 但 它 关 系 到 大 多 数 人 的 日 常生 活 ， 因 此 你 一 定 对 
它 感 兴趣 。 我 们 用 归纳 法 来 证 明 这 个 公式 的 正确 性 ， 这 对 归纳 法 是 个 很 好 的 说 明 。 

首先 ， 给 出 几 个 变量 的 名 称 及 其 含义 。 设 己 为 贷款 原始 数额 ， 称 为 本 金 。[ 盖 0 为 贷款 
的 年 利率 ， 一 0. 06 表示 年 利率 为 6%，Y 为 月 付款 数 。 为 简便 起 见 ， 用 工 定 义 另 一 个 变量 
M， 它 表示 月 倍增 系数 。 因 为 有 利息 的 缘故 ， 所 以 贷款 的 余额 每 个 月 按照 比率 M 会 发 生变 
化 。 因 为 月 利率 是 年 利率 的 1/12， 所 以 M=1 十 IV12， 并 且 逐 月 付 利息 GRA RA). 

每 个 月 还 款 有 两 部 分 。 第 一 部 分 是 ， 由 于 有 利息 ， 贷 款 的 余额 在 按照 月 倍增 系数 M 
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增加 。 第 二 部 分 是 ， 由 于 每 月 付款 ， 贷 款 余额 又 在 不 断 地 减少 。 设 P, 为 在 上 个 月 后 未 偿 
清 的 贷款 余额 ， 那 么 ，Po 二 P 为 贷款 的 原始 数额 ， 则 Pi 二 MPo 一 Y 为 一 个 月 后 的 贷款 余 
额 ，Ps 二 MP1 一 Y 为 两 个 月 后 的 贷款 余额 ， 等 等 ， 依 此 类 推 。 现 在 形式 化 描述 定理 ， 给 出 
P, 的 计算 公式 ， 并 且 通 过 对 t 的 归纳 来 证 明 公 式 的 正确 性 。 

CEI ”对 于 年 一 个 :二 0， 








P.=PM'—Y (77-7) 
证 明 ”归纳 基础 ”证明 当 :=0 时 公式 成 立 。 如 果 t= 二 0， 则 公式 为 
Wp 
这 里 MP 二 1。 因 而 可 以 简化 等 式 的 右 端 ， 得 到 
Po=P 


根据 上 面 对 Po 的 定义 ， 这 是 正确 的 。 因 此 ,证 明了 第 一 步 归 纳 基础 成 立 。 
归纳 步骤 ”对 于 每 一 个 k 宇 0 ， 假 设 当 三 & 时 公式 成 立 ， 现 要 证 当 上 一 & 十 1 时 公式 也 
成 立 。 由 归纳 假设 指出 





P, =pm'—y(“—) 


M-I 
现在 要 证 明 





pmpa y( Me) 


证 明 如 下 : 首先 ， 由 从 Pi 到 Pi+1 的 定义 ， 得 到 
Py41 = P,M—Y 
因此 ， 使 用 归纳 假设 可 计算 Pr, 44 


Pri =| PM -y (4 —*) M-Y 
把 M 乘 进 去 并 且 改 写 Y， 得 到 


Pt 一 PMe —y (MM) _y (4) — per -y (EET) 
于 是 ， 当 三 & 十 1 时 公式 也 成 立 ， 这 就 证 明了 定理 。 G 
请 参看 练习 0. 14， 试 试 采用 这 个 公式 计算 实际 的 抵押 付款 。 
练习 


0.1 考察 下 列 集合 的 形式 化 描述 ， 先 理解 它们 包括 什么 样 的 元 素 ， 写 一 段 简短 文字 描述 每 一 个 集合 。 
mL >), 
了 
c. {n | 对 NN 中 的 某 一 个 m,n 二 2m)})。 
d. {n | 对 NN 中 的 某 一 个 m,n 二 2m, 并 且 对 NN 中 的 某 个 有 ,n= 二 3&k)。 
e. (w |w 是 0,1 字符 串 , 且 ww 等 于 w 的 反 转 }。 
f. {n | n 是 一 个 整数 , 且 n= 二 nn 十 1}。 
0.2 试 写 出 下 列 集合 的 形式 化 描述 。 
a. 由 1、10 和 100 组 成 的 集合 。 b. 由 所 有 大 于 5 的 整数 组 成 的 集合 。 
ce 由 所 有 小 于 5 的 自然 数组 成 的 集合 。 d. 由 字符 串 aba 组 成 的 集合 。 
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e 由 空 串 组 成 的 集合 。 f. 空 的 集合 。 

0.3 WARRE {xz,y,z}，B 为 集合 {zx,y}。 
a.A 是 如 的 子 集 吗 ? d. ANB 等 于 什么 ? 
b. B ÆA 的 子 集 吗 ? e. AXB 等 于 什么 ? 
c. AUB 等 于 什么 ? f. BM RRS TTA? 


0.4 设 A 有 a 个 元 素 ，B 有 6。 个 元 素 , 问 AXB 中 有 和 多少 个 元 素 ? 说 明理 由 。 

0.5 设 C 是 包含 c 个 元 素 的 集合 ,试问 C 的 寡 集 中 有 多 少 个 元 素 ?9 说明 理由。 

0.6 设 X 为 集合 {1,2,3,4,5}, 为 集合 {6,7,8,9,10}。 一 元 函数 f:X>Y 和 二 元 函数 9:XXYY 
如 下 表 所 示 : 





a. f(2) 的 值 等 于 什么 ? b. f 的 值 域 和 定义 域 是 什么 ? 
c. 9(2,10) 的 值 等 于 什么 ? d. 9 的 值 域 和 定义 域 是 什么 ? 
e. 9(4,f/(4)) 的 值 等 于 什么 ? 
0.7 对 下 列 每 一 小 题 ， 给 出 一 个 满足 指定 条 件 的 关系 。 
a 自 反 的 和 对 称 的 ， 但 不 是 传递 的 。 b. 自 反 的 和 传递 的 ， 但 不 是 对 称 的 。 
c. 对 称 的 和 传递 的 ， 但 不 是 自 反 的 。 
0.8 考虑 无 向 图 G=(V.E), HRPM AR V={1,2,3,4}, WH E={{1,2},{2,3},{1,3},{2,4},{1, 
4}}。 画 出 图 C。 各 顶点 的 度数 是 多 少 ? 试 在 图 中 标 出 一 条 从 顶点 3 到 顶点 4 的 路 径 。 
0.9 试 写 出 下 述 图 的 形式 化 描述 。 





问题 
0.10 ” 试 证 明 每 个 包含 两 个 或 两 个 以 上 结 点 的 图 应 包含 有 相等 度数 的 两 个 结 点 。 
0.11 请 找 出 下 述 证 明 中 的 错误 ， 它 证 明 所 有 马 的 颜色 相同 。 
断言 ”在 任意 一 个 包含 h 匹 马 的 集合 中 ， 所 有 马 的 颜色 相同 。 
证 明 对 有 h 作 归纳 证 明 。 
归纳 基础 ”对 于 h==1， 在 任何 只 有 一 匹 马 的 集合 中 ， 显 然 所 有 马 的 颜色 相同 。 
归纳 步骤 ”对 于 有 宇 1。 假 设 命题 对 于 hh 二 为 真 ， 要 证 明 命 题 对 于 二 十 1 也 为 真 。 
S 互 为 任意 一 个 有 十 1 匹 马 的 集合 ， 现 在 要 证 明 这 个 集合 中 所 有 马 的 颜色 相同 。 
从 这 个 集合 中 牵 走 一 匹 马 ， 得 到 集合 H, MH PRYE kE, REBAB, H 中 所 有 马 的 
颜色 相同 。 现 在 把 牵 走 的 马 重新 牵 回 来 ， 再 牵 走 另外 一 匹 马 得 到 集合 互 : 。 根 据 同样 的 道理 ，HH， 
中 所 有 马 的 颜色 也 应 相同 。 因 此 ， 互 中 所 有 马 的 颜色 一 定 相 同 。 
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0.12 i SCz) 王 1 十 2 十 … 十 ?是 前 2 ARZ M, Cn) =18 +2 +. +n Bi n ALAA. 
通过 对 n 的 归纳 证 明 如 下 等 式 ， 从 而 得 到 对 每 一 个 n 有 C(n)= 二 S$S:(n) 这 一 有 趣 的 结论 。 
a. S(n)=+n(n+1), 
i: Cn) = (nt + 2n? +n?) =r? aH, 
0.13 请 找 出 下 述 证 明 2=1 中 的 错误 。 
提示 : 考虑 方程 a 二 5b5。 两 边 同 乘 以 a， 得 到 a? 一 ac。 两 边 同 时 减 去 0. 得 到 a? —b*=ab—b’, 
对 每 一 边 做 因 式 分 解 ， 得 (a 十 b) (a 一 6) 二 bl(a 一 b)。 用 (a 一 5) 除 每 一 边 ， 得 a 十 5 二 5b。 最后， 
令 a 和 6。 等 于 1， 得 证 2=1。 
A0.14 利用 定理 0. 15 试 推导 出 用 本 金 已 、 利 率 工 和 付款 次 数 上 计算 抵押 贷款 的 月 付款 额 的 公式 。 假 设 
在 付 上 次 款 之 后 ， 贷 款 余额 减少 为 0。 对 于 30 年 的 抵押 人 贷款， 假设 原 贷 款额 为 10 万 美元 ,年利 
率 为 5%， 用 360 个 月 偿 清 ， 试 用 公式 计算 每 个 月 的 还 款额 。 
A* 0.15 Ramsey 定理 。 设 G 是 一 个 图 ，G 中 的 团 (clique〉 为 任意 两 个 顶点 都 有 边 相 连 的 子 图 。 反 团 
(anti-clique) 又 叫 作 独立 集 (independent set) ， 它 为 任意 两 个 顶点 都 没有 边 相 连 的 子 图 。 试 证 
明 : 所 有 个 顶点 的 图 都 包含 一 个 顶点 数 不 少 于 -logzm 的 团 或 反 团 。 
习题 选 解 
0.14 4 P,=0 并 解 出 Y， 以 得 到 公式 ， Y= PM (M—1)/(M—-1). AHF P= $100 000, I=0.05, 
1 一 360， 可 以 得 到 M==1 十 (0.05)/12， 经 过 计算 得 到 每 月 应 还 款 为 Ya $ 536. 82。 
0.15 将 空间 划分 成 两 类 顶点 集 A 和 B。 然 后 扫描 整个 图 ， 如 果 顶 点 r 的 度数 大 于 空间 中 剩余 顶点 数 


目的 一 半 ， 则 把 xz 加 到 A 中 ， 否 则 将 其 加 到 B 中 。 如 果 xz 加 到 A 中 ， 则 不 再 考虑 所 有 不 与 其 
相连 的 项 点 ; 如 果 z 加 到 B 中 ， 则 不 再 考虑 所 有 与 其 相连 的 项 点。 重复 这 个 步骤 ， 直 到 处 理 完 
所 有 项 点。 由 于 每 一 步 最 多 丢弃 一 半 的 顶点 ， 因 此 至 少 需 要 经 过 logen 步 过 程 才 会 终止 。 由 于 


每 步 只 在 A 或 B 中 添加 一 个 顶点 ， 所 以 在 过 程 结束 后 A 或 B HEDE- logn 个 顶点 。 其 
中 ，A 中 包含 的 顶点 属于 团 ，B 中 包含 的 顶点 属于 反 团 。 
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计算 理论 的 第 一 个 问题 是 : 什么 是 计算 机 ? 这 或 许 是 一 个 很 简单 的 问题 ， 任 何人 都 知 
道 我 用 来 打字 的 这 个 东西 就 是 一 台 计 算 机 。 但 是 这 些 现实 的 计算 机 相当 复杂 ， 很 难 直接 对 
它们 建立 一 个 易于 处 理 的 数学 理论 ， 因此 采用 称 为 计算 模型 (computational model) W 
想 计算 机 来 描述 。 同 科学 中 的 其 他 模型 一 样 ， 一 个 计算 模型 准确 地 刻画 了 某 些 特征 ， 同 时 
忽略 一 些 特征 。 因 此 ， 针 对 关注 的 特性 ， 我 们 采用 几 个 不 同 的 计算 模型 。 本 书 从 最 人 简单 的 
模型 开始 ， 它 称 为 有 穷 状 态 机 (finite state machine) 或 有 穷 自 动机 9 (finite automaton), 


1.1 有 穷 自 动机 


有 穷 自 动机 是 描述 能 力 和 资源 极其 有 限 的 计算 机 的 模型 。 一 台 存 储 如 此 少 的 计算 机 能 
做 些 什 么 呢 ? 回答 是 : 能 做 很 多 有 用 的 事情 ! 由 于 这 样 的 计算 机 存在 于 各 种 各 样 的 机 电 设 
备 的 核心 部 位 ， 因 此 事实 上 ， 我 们 随时 都 在 和 它们 打交道 。 

如 图 1-1 所 示 ， 自 动 门 控制 器 就 是 这 类 设备 的 一 个 例子 。 


在 商场 的 人 口 和 出 口 常常 看 见 ， 当 控制 器 检测 到 有 人 正在 革 eal 
近 时 ， 自 动 门 就 会 打开 。 自 动 门 的 前 面 有 一 个 缓冲 区 ， 用 来 
检测 是 否 有 人 想 进 来 。 在 门 的 后 面 有 男 一 个 缓冲 区 ， 使 得 控 
制 器 把 门 打开 足够 长 的 时 间 让 人 走 进 来 并 且 不 让 门 在 打开 的 | 
时 候 碰 到 站 在 它 后 面 的 人 。 td 

控制 器 有 两 个 状态 : OPEN 和 CLOSED, 分 别 表示 门 的 开 和 关 ， 它 处 于 两 个 状态 之 
一 。 如 图 1-2 所 示 ， 有 4 种 可 能 的 输入 : FRONT (表示 门 前 面 的 缓冲 区 内 有 人 )、REAR 
(表示 门 后 面 的 缓冲 区 内 有 人 )、BOTH (表示 前 后 缓冲 区 内 都 有 人 )， 和 NEITHER (表示 
前 后 缓冲 区 内 都 没有 人 )。 

控制 器 根据 它 接收 的 输入 从 一 个 状态 转移 到 男 一 个 状态 。 当 它 处 于 CLOSED KA A 
接收 到 输入 NEITHER 或 REAR 时 ， 它 仍 处 于 CLOSED 状态 。 而 且 ， 如 果 接 收 到 输入 
BOTH， 它 也 停留 在 CLOSED 状态 ， 因 为 打开 门 有 撞 倒 在 后 缓冲 区 里 的 人 的 危险 。 但 是 ， 
如 果 输 入 FRONT 来 到 ， 它 便 转 移 到 OPEN KA. FE OPEN 状态 ， 如 果 接 收 到 输入 
FRONT, REAR 或 BOTH， 它 保持 在 OPEN 状态 不 动 。 如 果 输 入 NEITHER 来 到 ， 它 返 
回 到 CLOSED 状态 。 

例如 ， 控 制 器 可 能 开始 时 处 于 CLOSED 状态 并 且 接 收 到 下 述 一 系列 的 输入 信和 号 : 
FRONT, REAR, NEITHER, FRONT, BOTH, NEITHER, REAR, NEITHER. 那 
么 ， 它 会 经 过 下 述 状 态 ， CLOSED (F), OPEN, OPEN, CLOSED, OPEN, OPEN, 
CLOSED, CLOSED, CLOSED, 

用 有 穷 自 动机 理论 来 处 理 自动 门 控制 器 是 很 好 的 方法 。 可 以 采用 如 图 1-2 和 图 1- 3 所 


日 ”在 一 些 文献 中 也 被 译 为 “有 限 状 态 机 ”或 者 “有 限 自动 机 ”。 一 一 译 者 注 
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可 能 表示 电梯 所 在 的 楼 层 ， 而 输入 可 能 是 从 按钮 接收 到 的 信号 。 这 人 台 计 算 机 可 能 需要 若干 
位 存储 喜来 记 住 这 些 信 息 。 各 种 家 电 设备 ， 例 如 洗 碗 机 和 电子 恒温 上 器 以 及 部 分 电子 表 和 计 
算 侣 的 控制 部 也 都 是 只 有 有 限 存 储 的 计算 机 的 例子 。 设 计 这 种 装置 需要 知道 有 关 有 穷 自 动 
机 的 方法 和 术语 。 


REAR FRONT 
BOTH REAR 
NEITHER és BOTH 
FRONT 输入 信和 号 
NEITHER FRONT REAR BOTH 
状态 CLOSED| CLOSED OPEN CLOSED CLOSED 
NEITHER = OPEN CLOSED OPEN OPEN OPEN 
图 1-2 上 自动 门 控制 器 的 状态 图 图 1-3 上 自动 门 控制 器 的 状态 转移 表 


有 穷 自动 机 和 与 之 对 应 的 马尔 科 夫 链 (Markov chain) 常用 于 识别 数据 中 的 模式 。 这 
类 方法 常用 在 语音 处 理 和 光学 字符 识别 中 。 马 尔 科 夫 链 甚至 已 经 被 用 来 对 金融 市 场 中 价格 
的 变动 进行 建 模 和 预测 。 

下 面 从 数学 的 角度 考察 有 穷 自动 机 。 将 给 出 有 穷 自 动机 的 精确 定义 、 用 来 描述 和 处 理 
有 穷 自 动机 的 术语 以 及 描述 它们 的 能 力 及 其 限制 的 理论 结果 。 除 了 让 我 们 更 明确 地 理解 什 
么 是 有 穷 自 动机 和 它们 能 做 什么 、 不 能 做 什么 之 外 ， 这 些 理 论 开发 工作 还 能 使 我 们 在 一 个 
相对 简单 的 环境 中 了 解数 学 定义 、 定 理 和 证 明 ， 并 且 逐 渐变 得 更 加 得 心 应 手 。 

在 叙述 有 穷 目 动机 的 数学 理论 的 初期 ， 只 做 抽象 的 描述 ， 不 涉及 任何 具体 的 应 用 。 图 
1-4 描述 了 一 个 有 穷 目 动机 ， 它 被 称 为 Mi 。 

图 1-4 被 称 为 Mi 的 状态 图 (state diagram ) 。 
它 有 3 个 状态 ， 记 作 gq) a Mq ERIA (start 
state) q 用 一 个 指 回 它 的 无 出 发 点 的 箭头 表示 ， 接 
受 状态 (accept state) gs 珊 有 双 圈 。 从 一 个 状态 指 
向 另 一 个 状态 的 箭头 称 为 转移 (transition). 图 1-4 一 台 有 3 个 状态 的 有 穷 自动 机 Mi 

当 这 个 自动 机 接收 到 输入 字符 串 ， 例 如 1101 时 ， 它 处 理 这 个 字符 串 并 且 产 生 一 个 输 
出 。 输 出 是 接受 或 拒绝 。 为 简化 描述 过 程 ， 这 里 将 只 考虑 是 非 型 的 输出 。 处 理 从 Mi 的 起 
始 状 态 开 始 。 目 动机 从 左 至 右 一 个 接 一 个 地 接收 输入 字符 串 的 所 有 符号 。 读 到 一 个 符号 之 
后 ，Mi 泊 着 标 有 该 符号 的 转移 从 一 个 状态 移动 到 另 一 个 状态 。 当 读 到 最 后 一 个 符号 时 ， 
Mi 产生 它 的 输出 。 如 果 M 现在 处 于 一 个 接受 状态 ， 则 输出 为 接受 ; 否则 输出 为 拒绝 。 

例如 ， 把 输入 字符 串 1101 提供 给 图 1-4 中 的 有 穷 自动 机 Mi ， 处 理 步 又 如 下 : 
. 开始 时 处 于 状态 q- 
. 读 到 1， 沿 着 转移 从 q 到 g,。 
. 读 到 1， 沿 着 转移 从 q Pq- 
. 读 到 0， 沿 着 转移 从 q, 到 9q; 。 
. 读 到 1， 沿 着 转移 从 q, Bq. 
. 输出 接受 ， 因 为 在 输入 字符 串 的 末端 M 处 于 接受 状态 q,。 
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a2 B-RA 自动 机 与 语言 


用 这 人 台 机 器 对 各 式 各 样 的 输入 字符 串 进 行 试 验 ， 得 知 它 接受 字符 串 1、01、11 和 
0101010101。 事 实 上 ，Mi 接受 以 1 结尾 的 任何 0、1 串 ， 因 为 只 要 读 到 1 它 就 到 达 接 受 状 
态 g, 。 此 外 ， 它 还 接受 字符 串 100、0100、110000 和 0101000000， 以 及 在 最 后 一 个 1 的 后 
面 有 偶数 个 0 的 任何 0、1 串 。 它 拒绝 其 他 的 0、1 a, 例如 0，10，101000。 试 试 描述 由 
Mi 接受 的 所 有 字符 串 组 成 的 语言 ， 稍 后 我 们 将 做 这 件 事情 。 


1. 1.1 有 穷 自动 机 的 形式 化 定义 


上 一 小 节 用 状态 图 介绍 了 有 穷 自 动机 ， 这 一 小 节 将 形式 化 地 定义 有 穷 自 动机 。 虽 然 状 
态 图 易于 直观 地 理解 ， 但 基于 下 述 两 条 理由 还 需要 形式 化 的 定义 。 

首先 ， 形式 化 定义 是 精确 的 。 它 能 消除 有 关 在 一 台 有 穷 自动 机 中 任何 不 明确 的 疑点 。 
如 果 不 清 楚 有 穷 自动 机 是 否 可 以 没有 接受 状态 ,或 者 对 各 个 可 能 的 输入 符号 从 每 一 个 状态 
是 否 一 定 恰好 引出 一 个 转移 ， 那 么 可 以 查阅 它 的 形式 化 定义 ， 并 且 得 到 证 实 对 这 两 个 问题 
的 回答 是 肯定 的 。 其 次 ， 形 式 化 定义 提供 了 一 种 表示 方法 ， 好 的 表示 方法 有 助 于 思考 并 清 
楚 地 表达 出 你 的 思想 。 

形式 化 定义 的 语言 多 少 有 点 神秘 ， 与 法 律 文件 的 语言 有 一 些 相 似 之 处 。 两 者 都 必须 是 
精确 的 ， 每 一 个 细节 必须 给 予 清楚 的 说 明 。 

一 台 有 穷 自 动机 有 若干 部 分 。 它 有 一 个 状态 集 和 根据 输入 符号 从 一 个 状态 到 另 一 个 状 
态 的 规则 。 它 有 一 个 输入 字母 表 ， 指 明 所 有 人 允许 的 输入 符号 。 它 还 有 一 个 起 始 状 态 和 一 个 
接受 状态 集 。 形 式 化 定义 把 一 台 有 穷 自 动机 描述 成 一 张 含 以 下 5 部 分 的 表 : 状态 集 、 输 入 
字母 表 、 动 作 规则 、 起 始 状 态 以 及 接受 状态 集 。 用 数学 语言 表达 ，5 个 元 素 的 表 经 常 称 为 
5 元 组 。 因 此 ， 定 义 有 穷 自 动机 是 由 这 5 部 分 组 成 的 5 元 组 。 

用 转移 函数 (transition function) 定义 动作 规则 ， 常 记 作 5。 如 果 有 穷 自 动机 有 从 状 
AS x 到 状态 y 标 有 输入 符号 1 的 箭头 ， 这 表示 当 它 处 于 状态 zx 时 读 到 1， 则 转移 到 状态 y。 
可 以 用 转移 函数 讲 清楚 这 件 事 情 ， 记 作 SCz,1) 王 y。 这 个 记号 是 一 种 数学 简写 方式 。 把 这 
些 结合 在 一 起 得 到 有 穷 自动 机 的 形式 化 定义 。 

有 穷 自 动机 是 一 个 5 元 组 (Q,5,6,g,,F)， 其 中 

1.Q 是 一 个 有 穷 集合 ， 称 为 状态 集 。 

2.5 是 一 个 有 穷 集合 ， 称 为 字母 表 。 

3.6: QXI>Q 是 转移 函数 9 。 

4. go EQ 是 起 始 状 态 。 

5. FEQ 是 接受 状态 集 呈 。 

上 述 形式 化 定义 精确 地 描述 了 有 穷 自 动机 。 例 如 ， 回 到 先前 提出 的 那个 问题 : LAR 
许 没有 接受 状态 ?可 以 看 到 ， 如 果 令 下 等 于 空 集 儿 就 没有 接受 状态 ， 因 此 对 这 个 问题 的 回 
答 是 肯定 的 。 此 外 ， 转 移 函 数 6 对 一 个 状态 和 一 个 输入 符号 的 每 一 种 可 能 的 组 合 恰好 指定 
了 下 一 个 状态 。 这 就 对 第 二 个 问题 做 出 肯定 的 回答 ， 表 明 对 各 个 可 能 的 输入 符号 从 每 一 个 
状态 恰好 引出 一 个 转移 箭头 。 

通过 指定 定义 1. 1 中 列 出 的 5 部 分 ， 可 以 用 这 个 形式 化 定义 的 记号 描述 各 个 具体 的 有 穷 


O ”如 果 不 清楚 6: QX5>Q 的 含义 ， 请 参阅 0.2.3 市 。 
加 ”接受 状态 有 时 也 称 作 终 结 状态 (final state), 
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自动 机 。 例 如 ， 回 到 图 1- 4 描述 的 有 穷 自动 机 Mi 。 为 便于 描述 在 这 里 将 其 重 画 ， 如 图 1- 5 
所 示 。 

可 以 把 Mi 形式 地 写成 Mi =(Q,2,059,,F); 
其 中 

1. Q={g ,qz ,43}。 

2.+2={0,1}., 

3. S 描述 为 图 1-5 有 穷 自 动机 Mi 








4.q, 是 起 始 状态 。 

Sa =i 上 

E A 是 机 器 M 接受 的 全 部 字符 串 集 ， 则 称 A 是 机 器 M 的 语言 ， 记 作 工 (M) =A., X 
称 M 识别 A 或 M 接受 A。 由 于 在 说 机 器 接受 字符 串 和 机 器 接受 语言 时 接受 一 词 有 不 同 的 
含义 ， 所 以 我 们 倾向 于 对 语言 使 用 识别 二 字 以 避免 混淆 。 

一 台 机 器 可 能 接受 大 干 字符 串 ， 但 是 它 永 远 只 能 识别 一 个 语言 。 如 果 机 器 不 接受 任何 
字符 串 ， 那 么 它 仍然 识别 一 个 语言 ， 即 空 语言 名 。 

在 上 面 的 例子 中 ， 令 

A= 王 (zj| 取 至 少 含 有 一 个 1 并 且 在 最 后 的 1 后面 有 偶数 个 0) 

IWA, LIM) =A, REFI, Mi 识别 A. 


1.1.2 ”有 穷 目 动机 举例 


图 1-6 是 有 穷 自 动机 Mz 的 状态 图 。 
采用 形式 化 描述 ， Mz 一 《to rg)» {0,1},654q, > 
{q,}). BRM 8 为 





图 1-6 2- 状 态 有 穷 目 动机 Ms: 的 状态 图 


注意 ，M2 的 状态 图 和 M: 的 形式 化 描述 包含 相同 的 信息 ， 仅 仅 是 形式 不 同 。 如 果 需 
要 ， 总 可 以 由 其 中 的 一 个 得 到 另 一 个 。 

了 解 一 台 机 器 的 常用 方法 是 用 几 个 样本 输入 串 做 测试 。 当 做 这 些 “ 试 验 ” 观 察 机 器 如 
何 工 作 的 时 候 ， 通常， 它 的 运行 方式 会 变 得 十 分 清楚 。 对 于 样本 串 1101, Me 从 它 的 起 始 
状态 gq, 开始 ， 首 先 读 到 第 一 个 1 后 转移 到 状态 g, ， 然 后 在 读 到 1，0 和 1 后 进入 到 状态 
Qo» 9 和 q 。 这 个 字符 串 被 接受 ， 因 为 状态 q 是 接受 状态 。 而 字符 串 110 使 M: 停留 在 
状态 gi ， 所 以 它 被 拒绝 。 再 试 几 个 例子 之 后 ， 可 以 看 出 M 接受 所 有 以 1 结束 的 字符 串 。 
FÆ, L(M:)={w|w 以 1 结束 }。 


考虑 有 穷 自 动机 Ma ， 见 图 1- 7。 


RRERSANME ZI, Bla Ms 5M: 一 样 。 照 例 ，Ms 接受 所 有 读 完 之 后 停留 在 接 
受 状 态 的 字符 串 。 注 意 ， 因 为 起 始 状 态 同 时 也 是 接 
受 状态 ， 所 以 Ms 接受 空 串 s， 只 要 机 器 一 开始 读 a oe oS 
空 串 ， 处 理 就 结束 了 。 因 此， 如 果 起 始 状 态 是 接受 
状态 ， 则 s 被 接受 。 除 空 串 之 外 ， 这 人 台 机 器 接受 任 人 te) 
何以 0 结束 的 字符 串 。 从 而 ， 

L(M3)={wlw 22 He ROB R) a BVT RSA ASM HRS 
“eee 图 1-8 给 出 一 台 5- 状 态 机 器 M. 
Blas M 有 两 个 接受 状态 q 和 ri， 在 字母 表 

5 二 {a,b)} 上 运行 。 试 验 表 明 它 接受 字符 串 a，b， 
aa, bb 和 bab, 但 是 不 接受 字符 品 ab，ba 和 bb- 
ba。 这 台 机 器 从 状态 s 开始 ， 在 读 入 输入 字符 串 的 
第 一 个 符号 之 后 它 或 者 向 左 进入 g 状态 ,或 者 向 右 
进入 r 状态 。 不 论 是 哪 种 情况 ， 它 都 不 可 能 返回 到 
起 始 状 态 (这 与 前 几 个 例子 是 不 同 的 )， 因 为 它 没 
有 办 法 从 任何 其 他 状态 回 到 状态 ;s。 如 果 输 入 字符 图 1-8 有 穷 自动 机 Mi 

串 的 第 一 个 符号 是 a， 那 么 它 向 左 走 并 且 当 输入 串 

以 a 结束 时 接受 。 类 似 地 ， 如 果 第 一 个 符号 是 bb， 那么 它 向 右 走 并 且 当 输入 串 以 b 结束 时 
接受 。 所 以 ，M4 接受 开头 和 结尾 都 是 a 或 者 开头 和 结尾 都 是 b 的 所 有 字符 串 。 亦 即 Mı 
接受 开头 和 结尾 符号 相同 的 所 有 字符 串 。 a 

图 1-9 给 出 3- 状 态 机 器 Ms ， 它 的 输入 字母 表 有 4 个 符号 ，3 一 {(RESET)， 
0,1,2}. #2 〈RESET》 看 作 一 个 符号 。 

机 器 Ms 以 模 3 的 方式 记录 它 在 输入 字符 串 
中 读 到 的 数字 之 和 。 每 次 读 到 符号 (RESET), 
它 将 计数 重新 置 0。 如 果 和 模 3 等 于 0， gjg: 
和 是 3 的 倍数 ， 则 Ms 接受 。 

在 某 些 情况 下 无 法 用 状态 图 来 描述 有 穷 A 
动机 。 当 状态 图 画 起 来 太 大 ， 或 者 像 在 下 个 例 
子 中 描述 依赖 于 有 穷 自 动机 的 某 个 未 具体 指定 
的 参数 时 就 有 可 能 这 样 。 在 这 些 情 况 下 ， 将 采 
用 形式 化 描述 来 说 明 机 器 。 

Yee 考虑 例 1. 5 的 推广 ， 使 用 与 例 1.5 相同 的 4 个 符号 的 字母 表 工 。 对 每 一 
;之 1， 设 A 是 所 有 这 种 字符 串 的 语言 ， 其 中 数字 之 和 是 ;的 倍数 ， 当 磁 到 符号 (RESET) 
时 ， 和 被 重新 置 0。 对 于 每 一 个 A;， 给 出 识别 它 的 有 穷 自动 机 B;。 形 式 地 描述 机 器 Bi 如 
PB: B= innl 这 里 人 是 i 个 状态 的 集合 artit da 设计 转移 
函数 6; 使 得 对 每 一 个 j， 若 B; Fo, 时 ， 此 时 的 和 模 i 等 于 j。 对 每 一 个 g,， 令 

ôi Cq; ,0)=g; 
ôi (q; 1) =q, xk E k= JH mod 7 
ôi (q; »2)=q, 3% E k=j+2 modi 








图 1-9 有 穷 自 动机 M; 


5;(q, RESET) ) =q, x 


1.1.3 计算 的 形式 化 定义 


至 此 已 用 状态 图 非 形 式 化 地 描述 了 有 穷 自 动机 ， 同 时 又 用 5 元 组 作为 形式 化 定义 描述 
了 它 。 非 形式 化 描述 易于 在 初期 掌握 ， 而 形式 化 定义 是 把 概念 完全 搞 清 楚 的 好 方法 。 形 式 
化 定义 能 够 清除 在 非 形式 化 描述 中 可 能 出 现 的 任何 二 义 性 。 下 面 对 有 穷 自动 机 的 计算 也 这 
样 做 。 由 于 已 经 有 了 关于 有 穷 自动 机 计算 方式 的 非 形式 的 想法 ， 现 在 就 把 它 数学 地 形 
AG 

设 M=(Q,3,0,q,,F) 是 一 台 有 穷 自动 机 ，w 二 wiw2z… w 是 一 个 字符 串 并 且 其 中 任 
一 wi 是 字母 表 3 的 成 员 。 如 果 存 在 Q 中 的 状态 序列 ro ,ri ，…,r,， 满 足下 述 条 件 : 

le ts =, 

2. lri »>Wi4+1)= rit+1s1=0,° n— l1 

3.rn EF 
则 M Sw, 

条 件 1 说 机 器 从 起 始 状态 开始 。 条 件 2 说 机 器 按照 转移 函数 从 一 个 状态 到 一 个 状态 。 
条 件 3 说 如 果 机 器 结束 在 接受 状态 ， 则 接受 它 的 输入 。 如 果 A 二 {w|M 接受 w}， 则 称 M 
识别 语言 A。 

如 果 一 个 语言 被 一 台 有 穷 自 动机 识别 ， 则 称 它 是 正则 语言 (regular lan- 
guage) 。 

以 例 1. 5 中 的 机 器 Ms 为 例 ， 令 由 是 字符 串 

10(RESET) 22(RESET) 012 
由 于 当 Ms 对 w 计算 时 进入 的 状态 序列 为 
do 291 991 40 292 41 40 9 Wy 2°91 9 FU 

它 满足 上 述 3 个 条 件 ， 根 据 计算 的 形式 化 定义 ，Ms Hew. Ms 的 语言 是 

LOCM5 ) 二 {w| 除 (RESET) 将 计数 重新 置 0 之 外 ,w 中 所 有 符号 之 和 模 3 等 于 0) 
因为 Ms 识别 该 语言 ， 所 以 它 是 正则 语言 。 aH 


1.1.4 设计 有 穷 自 动机 


不 论 是 自动 机 还 是 艺术 品 ， 设 计 都 是 一 个 创作 过 程 ， 因 此 不 可 能 把 它 归 结 为 一 个 简单 
的 处 方 或 公式 。 然 而 ， 可 以 找到 一 种 特殊 的 做 法 ， 在 设计 各 种 类 型 的 自动 机 时 都 是 有 帮助 
的 。 设 计 者 把 自己 放 在 所 要 设计 的 机 需 的 位 置 上 ， 考 虑 一 下 如 何 去 实 现 机 器 的 任务 。 把 自 
己 假 想 成 机 需 是 一 种 心理 上 的 技巧 ， 有 助 于 设计 者 把 全 部 思维 投入 到 设计 过 程 中 。 

用 上 面 描述 的 “读者 即 上 自动 机 ”方法 设计 有 穷 自 动机 。 假 设 有 某 个 语言 ， 要 设计 一 台 
识别 它 的 有 穷 目 动机 。 假 定 设 计 者 自己 就 是 这 台 有 穷 自动 机 ， 接 到 一 个 输入 字符 串 并 且 要 
确定 它 是 不 是 这 人 台 上 自动 机 所 识别 的 语言 的 成 员 。 设 计 者 一 个 接 一 个 地 读 这 个 字符 串 的 符 
号 。 在 读 到 每 一 个 符号 之 后 设计 者 必须 确定 到 现在 为 止 所 看 到 的 字符 串 是 否 在 这 个 语言 
中 。 理 由 是 设计 者 和 机 画 一 样 不 知道 字符 串 什 么 时 候 结 束 ， 因 此 必须 随时 准备 好 答案 。 

首先 ， 为 了 能 做 出 这 样 的 判断 ， 必 须 佑 算出 当 读 一 个 字符 串 时 需要 记 住 它 的 哪些 东 
西 。 为 什么 不 直接 记 住所 看 到 的 全 部 东西 呢 ? 记 住 当 前 设计 者 是 一 台 有 穷 自 动机 ， 这 种 类 


型 的 机 器 只 有 有 穷 个 状态 ， 这 意味 着 只 有 一 个 有 穷 的 存储 器 。 想 象 某 个 输入 极 长 ， 比 如 说 
有 从 地 球 到 月 球 那 么 长 ， 因 此 设计 者 不 可 能 记 住 所 有 的 事情 。 设 计 者 有 一 个 有 穷 的 存储 
器 ， 比 如 说 是 一 张 纸 ， 它 只 有 有 限 的 存储 能 力 。 幸 运 的 是 ， 对 许多 语言 不 需要 记 住 整个 输 
入 ， 只 需要 记 住 某 些 关键 的 信息 ， 那 些 信息 恰好 是 关键 的 并 且 与 所 考虑 的 具体 语言 有 关 。 

例如 ， 假 设 字母 表 是 《0,1}， 所 考虑 的 语言 由 所 有 含有 奇数 个 1 的 字符 串 组 成 。 目 标 
是 构造 一 台 有 穷 自动 机 Ei 以 识别 这 个 语言 。 设 想 设 计 者 就 是 这 人 台 自 动机 ， 开 始 一 个 符号 
接 一 个 符号 地 得 到 一 个 0、1 输入 串 。 为 了 确定 1 的 个 数 是 否 为 奇数 ， 需 要 记 住 至 此 所 看 
到 的 整个 字符 串 吗 ? 当然 不 需要 。 只 需 简 单 地 记 住 至 此 所 看 到 的 1 的 个 数 是 侦 数 还 是 奇 
数 ， 并 且 在 读 新 的 符号 时 保持 与 这 个 信息 的 联系 。 如 果 读 到 1， 就 把 答案 从 侦 数 变 成 奇数 
或 者 从 奇数 变 成 偶数 。 如 果 读 到 0， 则 答案 保持 不 变 。 

但 是 这 些 怎样 帮助 设计 者 设计 Ei 呢 ? 一 旦 确定 了 要 记 住 的 有 关 读 过 的 字符 串 的 必要 
言 息 ， 就 把 这 些 信息 列 成 一 份 可 能 性 的 有 限 清 单 。 在 这 个 实例 中 ， 可 能 性 有 : 

1. 到 此 为 止 是 偶数 。 

2. 到 此 为 止 是 奇数 。 
然后 ， 给 每 一 种 可 能 性 设计 一 个 状态 。 这 些 就 是 E 的 全 部 状态 ， 如 图 1- 10 所 示 。 

然后 ， 通 过 观察 如 何 根 据 读 到 的 符号 从 一 种 可 能 性 到 另 一 种 可 能 性 来 设计 转移 。 因 
此 ， 如 果 状 态 deven KI R RE REE, ARE gous 表示 奇数 可 能 性 ， 这 样 可 以 给 出 所 有 的 转 
移 ， 读 到 1 改变 状态 ， 读 到 0 保持 状态 不 变 ， 如 图 1- 11 所 示 。 





图 I= 10 状态 Deven MAR AS odd 


接 下 来 ， 把 起 始 状态 设置 为 对 应 于 到 现在 为 止 还 没有 看 到 与 
任何 符号 SH se) 相关 联 的 可 能 性 的 状态 。 在 这 个 例子 中 ， 起 
始 状态 是 状态 gq. ， 因 为 0 是 偶数 。 最 后 ， 把 接受 状态 设置 为 这 
样 一 些 状态 ， 它 们 都 对 应 于 自动 机 打算 要 接受 输入 字符 串 的 可 能 
性 。 令 9 为 接受 状态 ， 因 为 当 看 到 奇数 个 1 时 就 打算 要 接受 。 图 1-12 增加 起 始 状态 
这 些 添加 的 内 容 在 图 1- 12 中 给 出 。 和 接受 状态 

CER 本 例 说 明 如 何 设计 有 穷 自 动机 Ex ， 使 其 能 识别 含有 001 作为 子 串 的 所 有 字 
符 串 组 成 的 正则 语言 。 例 如 ，0010，1001，001 和 11111110011111 都 在 这 个 语言 中 ， 而 
11 和 0000 则 不 在 这 个 语言 中 。 如 果 设 计 者 是 Es ， 他 会 怎样 识别 这 个 语言 呢 ? 当 符 号 一 个 
接 一 个 地 到 来 时 ， 他 开始 可 能 要 跳 过 所 有 的 1。 如 果 得 到 一 个 0， 那 么 注意 到 ， 他 此 时 可 
能 刚刚 看 见 所 要 寻找 的 模式 001 中 的 第 一 个 符号 。 如 果 接 着 看 见 一 个 1， 由 于 0 的 个 数 不 
够 ， 所 以 返回 去 跳 过 1。 但 是 ， 如 果 接 着 看 见 一 个 0， 则 应 该 记 住 已 经 看 见 模 式 的 两 个 符 
号 。 现 在 只 需要 继续 扫描 直到 看 见 一 个 1 为 止 。 如 果 找 到 1， 那 么 记 住 已 经 成 功 地 找到 模 
式 001， 并 且 继 续 读 完 输入 字符 串 。 

因此 ， 有 4 种 可 能 性 : 

1. 刚才 没有 看 见 模式 的 任何 符号 。 





PIF 正则 语言 27 


2. 刚才 看 见 一 个 9。 

3. 刚才 看 见 00。 

4. 已 经 看 见 整 个 模式 001, 

HAIRS qs dos doo Ml goo 分 别 表示 这 4 种 可 能 性 。 通 过 下 述 观 察 可 以 给 出 所 有 的 转移 : 
在 q 读 到 1 时 仍 停 在 g 而 读 到 0 时 转移 到 g,; 在 au 读 到 1 时 返回 到 9 而 读 到 0 时 转移 到 
doo; 在 goo 读 到 1 时 转移 到 qoo 而 读 到 0 时 仍 停留 在 quo; 最 后 ， 在 qoo1 读 到 0 或 1 时 都 停 
FATE doo, 。 起 始 状 态 是 gq9， 唯 一 的 接受 状态 是 guo ， 如 图 1- 13 所 示 。 


0,1 





图 1-13 接受 含有 001 的 字符 串 a 


1.1.5 正则 运算 


在 前 两 个 小 节 中 我 们 介绍 并 定义 了 有 穷 自 动机 和 正则 语言 ， 现 在 开始 考察 它们 的 性 
质 。 这 些 工作 有 助 于 开发 一 个 工具 箱 ， 它 提供 在 设计 识别 特定 语言 的 有 穷 自动 机 时 需要 的 
技术 。 工 具 箱 还 包括 证 明 某 些 其 他 语言 不 是 正则 语言 〈 即 ， 超 出 了 有 穷 目 动机 的 能 力 ) 的 
FE « 

在 算术 中 ， 基 本 对 象 是 数 ， 工 具 是 处 理 数 的 运算 ， 如 十 和 X。 在 计算 理论 中 ， 对 象 是 
语言 ， 工 具 包 括 为 处 理 语 言 专门 设计 的 运算 。 定 义 语 言 的 三 种 运算 ， 称 为 正则 运算 
(regular operation) ， 并 且 使 用 这 些 运算 来 研究 正则 语言 的 性 质 。 

设 A 和 已 是 两 个 语言 ， 定 义 正 则 运算 并 (union)、 连 接 (concatena- 
tion) 和 星 号 (star) wF: 

。 并: AUB=(zlzEA 或 工 E 了 B) 

。 连接 : A-B={zy|rEA BH yEB}) 

eo BE, A* = {zit tr |k20 且 每 一 个 t EA 

大 家 对 并 运算 已 经 很 熟悉 , 它 把 A 和 B 中 的 所 有 字符 串 合 并 在 一 个 语言 中 。 

连接 运算 有 点 小 花招 。 它 以 所 有 可 能 的 方式 ， 把 A 中 的 一 个 字符 串 接 在 B 中 的 一 个 
字符 串 的 前 面 ， 得 到 新 的 语言 中 的 全 部 字符 串 。 

星 号 运算 与 前 两 个 运算 有 点 不 同 ， 因 为 它 作 用 于 一 个 语言 而 不 是 两 个 语言 。 亦 即 ， 星 
号 运算 是 一 元 运算 (unary operation) 而 不 是 二 元 运算 (binary operation)。 它 把 A 中 的 
任意 个 字符 串 连 接 在 一 起 得 到 新 语言 中 的 一 个 字符 串 。 因 为 “任意 个 ”包括 0 个 在 内 ， 所 
以 不 管 A BTA, SRe 总 是 A* 的 一 个 成 员 。 

ORED 设 字母 表 王 是 标准 的 26 个 字母 {a,b,…,z}。 又 设 A=(good, bad}, B= 
{boy,girl}, J 

AU B= (good, bad, boy, girl}, 

AeB=({goodboy, goodgirl, badboy, badgirl}, 

A* ={e, good, bad, goodgood, goodbad, badgood, badbad, 
goodgoodgood, goodgoodbad, goodbadgood, goodbadbad, °::} a 
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设 N 二 {1,2,3,…) 是 自然 数 集 。 说 N 在 乘法 运算 下 封闭 的 意思 是 ， 对 N PERK x 
和 yy， 乘 积 xXy 也 在 N 中 。 相 反 地 ，N 在 除法 下 不 是 封闭 的 ， 因 为 1 和 2 在 N 中 ， 而 1/ 
2 不 在 N 中 。 一 般 说 来 ， 如 果 把 某 种 运算 应 用 于 一 个 对 象 集合 的 成 员 得 到 的 对 象 仍 在 这 个 
集合 中 ， 则 称 这 个 对 象 集合 在 该 运算 下 封闭 。 下 面 证 明正 则 语言 类 在 三 种 正则 运算 下 封 
闭 。 在 1.3 市 将 会 看 到 这 些 封 闭 性 对 于 人 处理 正则 语言 和 了 人 解 有 穷 自 动机 的 能 力 是 有 用 的 工 
具 。 首 先 ， 从 证 明 并 运算 开始 。 

正则 语言 类 在 并 运算 下 封闭 。 

换言之 ， 如 果 Al 和 As; RENH, MAUA: 也 是 正则 语言 。 

证 明 思 路 有 两 个 正则 语言 A MA, ZWE A UA: 也 是 正则 的 。 由 于 Al 和 A 是 
正则 的 ， 所 以 有 一 台 有 穷 自动 机 Mi 识别 A1 和 一 台 有 穷 自 动机 Ms 识别 Az. X TuE A 
UA, 是 正则 的 ， 因 而 要 证 明 有 一 台 有 穷 自 动机 识别 A UA* ， 把 它 称 为 M。 

这 是 一 个 构造 性 证 明 。 利 用 M 和 Ms 构造 M。 为 了 识别 并 语言 A UA, HUA M 必 
须 恰 好 在 Mi 或 Me 接受 的 时 候 接受 它 的 输入 串 。M 模拟 Mi 和 Ms 并 且 当 这 两 个 模拟 中 
有 一 个 接受 时 ，M 接受 。 

Plas M 怎样 模拟 Mi 和 Ms 呢 ? 它 可 能 是 先 在 输入 上 模拟 Mi ， 然 后 再 在 输入 上 模拟 
Mi。 但是， 在 这 里 必须 小 心 ! 一 旦 输入 中 的 符号 被 读 过 且 用 于 模拟 Mi ， 就 不 可 能 为 了 模 
拟 M，。“ 把 输入 市 重新 绕 回 去 ”。 因 而 需要 用 男 外 的 方法 。 

设计 者 可 以 设想 目 己 就 是 M。 当 输入 符号 一 个 接 一 个 地 来 到 时 ， 同 时 模拟 Mi 和 M2, 
但 只 能 经 过 输入 串 一 次 。 但 是 ， 能 够 用 有 穷 的 存储 同时 记 住 两 个 模拟 吗 ? 需要 记 住 的 全 部 
内 容 是 ， 当 每 一 人 台 机 需 读 到 输入 字符 串 的 这 个 地 方 时 ， 它 会 处 在 什么 状态 。 因 此 需要 记 住 
一 对 状态 。 可 能 会 有 多 少 对 状态 ? WR M A ki 个 状态 ，M Ak 个 状态 ， 那 么 一 共有 
ki Xko 对 状态 ， 其 中 一 个 状态 来 自 M1， 男 一 个 状态 来 自 M2 。 这 个 数目 将 是 M 的 状态 数 ， 
Mi 和 Ms 的 一 对 状态 是 M 的 一 个 状态 。M 的 转移 从 一 对 状态 到 一 对 状态 ， 同 时 修改 M: 
和 M2 当前 的 状态 。 当 Mi 或 Mi 的 状态 是 接受 状态 时 ， 这 对 状态 是 M 的 接受 状态 。 

WEAR 设 Mi Wa Ai, M: 识别 Az, HP 

My = (Qi) 53501 ,9ql > F 1) M2: = (Q2 ， >,02 3q, F2) 
构造 识别 A UA: WM, XE M=, F). 

1Q={((norD|InE€Q HrEQ). RE QE SQA HAFILA, BREA XQ. 
它 是 第 一 个 元 素 取 目 Qi 、 第 二 个 元 素 取 目 Q 的 所 有 的 状态 有 序 对 组 成 的 集合 。 

2. FRZ, 5M., M 的 字母 表 相 同 。 在 这 个 定理 以 及 随后 所 有 类 似 的 定理 中 ， 为 
简单 起 见 ， 假 设 M 和 Ms 有 相同 的 输入 字母 表 。 如 果 它 们 有 不 相同 的 字母 表 B31 和 Se, 
定理 仍然 成 立 。 不 过 要 修改 证 明 ， 令 35=31 U. 

3. 转移 函数 6 定义 如 下 : 对 每 一 对 (ri ,r2)EQ 和 每 一 个 waE 王 ， 令 

OC(r1 972) 5a) = (81 Cri a) 502 (r2 ,a)) 
FÆ., ORM 的 一 个 状态 CER EZRA Mi 和 Ms: 的 一 对 状态 ) 和 一 个 输入 符号 ， 返 
回 M 的 下 一 个 状态 。 
d. q 是 有 序 对 (gq, ，g,)。 
5. 下 等 于 有 一 个 元 素 是 Mi 或 Mz 的 接受 状态 的 有 序 对 组 成 的 集合 。 它 可 以 写成 
下 
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这 个 表达 式 与 下 = 二 (Fi XQz)U(QXF,) WF. ŒE: ES F=F XF 不 同 。 这 个 表达 
式 能 给 我 们 提供 什么 呢 ?) 呈 

至 此 ， 构 造 识别 A UA: 的 有 穷 自动 机 M 的 工作 已 经 完成 。 这 个 构造 相当 简单 ， 因 而 
根据 在 证 明 思路 中 描述 的 策略 ， 它 的 正确 性 是 显然 的 。 更 复杂 的 构造 要 求 增加 证 明正 确 性 
的 讨论 。 通 和 常 采 用 归纳 法 形式 地 证 明 这 类 构造 的 正确 性 。 作 为 一 个 例子 ， 请 看 定理 1. 28 
的 证 明 。 本 课程 中 大 多 数 这 类 构造 都 相当 简单 ， 因 而 不 需要 形式 化 的 正确 性 证 明 。 im 

刚才 证 明了 两 个 正则 语言 的 并 集 是 正则 的 ， 因 而 证 明正 则 语言 类 在 并 运算 下 封闭 。 接 
下 来 转 到 连接 运算 ， 并 且 试 着 证 明正 则 语言 类 在 该 运算 下 也 封闭 。 

正则 语言 类 在 连接 运算 下 封闭 。 

换言之 ， 如 果 Al 和 As 是 正则 语言 ， 则 A ° A 也 是 正则 语言 。 

为 了 证 明 这 个 定理 ， 让 我 们 按照 关于 并 运算 下 封闭 的 证 明 线 索 试 一 试 。 和 前 面 一 样 ， 
从 假设 有 穷 自动 机 Mi 和 Me 分别 识别 正则 语言 A 和 Ao 开始 。 但 是 ， 现 在 设计 的 有 穷 自 
动机 M 不 是 当 Mi E M: 接受 输入 时 它 才 接受 输入 ， 而 应 该 是 当 它 的 输入 可 以 被 分 成 两 
E, Mi 接受 第 一 段 且 M: 接受 第 二 段 时 ，M 才 接 受 输 入 。 问 题 是 M 不 知道 在 什么 地 方 把 
人 的 输入 分 开 〈 即 在 什么 地 方 第 一 段 结束 和 第 二 段 开 始 )。 为 了 解决 这 个 问题 ， 引 入 所 谓 
非 确 定性 的 新 技术 。 


1.2 非 确 定性 


非 确定 性 是 一 个 有 用 的 概念 ， 已 经 对 计算 理论 产生 了 巨大 的 影响 。 至 今 在 我 们 的 讨论 
中 ， 计 算 的 每 一 步 都 按照 唯一 的 方式 跟 在 前 一 步 的 后 面 。 当 机 器 处 于 给 定 的 状态 并 读 人 下 
一 个 输入 符号 时 ， 可 以 知道 机 器 的 下 一 个 状态 是 什么 一 一 它 是 确定 的 。 因 此 ， 称 这 是 确定 
型 计算 (deterministic computation) 。 在 非 确 定型 (nondeterministic) 机 器 中 ， 在 任何 一 
点 ， 下 一 个 状态 可 能 存在 寿 干 个 选择 。 

非 确 定性 是 确定 性 的 推广 ， 因 此 每 一 台 确 定型 有 穷 自 动机 自动 地 是 一 台 非 确定 型 有 穷 
目 动机 。 如 图 1- 14 所 示 ， 非 确定 型 有 穷 自动 机 可 能 有 一 些 另外 的 特征 。 


0, 1 0, 1 
3 £ 
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图 1-14 非 确定 型 有 穷 自 动机 Ni 


确定 型 有 穷 自动 机 (简称 DFA) 与 非 确定 型 有 穷 自 动机 (简称 NFA) 之 间 的 区 别 是 
显而易见 的 。 第 一 ，DFA 的 每 一 个 状态 对 于 字母 表 中 的 每 一 个 符号 总 是 恰好 有 一 个 转移 
箭头 射出 。 图 1- 14 中 给 出 的 非 确定 型 自动 机 违背 了 这 条 规则 。 状 态 a, 对 于 0 有 一 个 射出 
的 箭头 ， 而 对 于 1 有 两 个 射出 的 箭头 ; gq, 对 于 0 有 一 个 箭头 ， 而 对 于 1 没有 箭头 。 在 
NFA 中 ， 一 个 状态 对 于 字母 表 中 的 每 一 个 符号 可 能 有 0 个 、1 个 或 多 个 射出 的 箭头 。 

第 二 ， 在 DFA 中 ， 转 移 箭 头 上 的 标号 是 取 自 字母 表 的 符号 。NFA Ni 有 一 个 带 有 标 


O 这 个 表达 式 把 M 的 接受 状态 定义 为 两 个 元 素 都 是 接受 状态 的 有 序 对 。 在 这 种 情况 下 ，M 接受 一 个 字符 串 仅 当 
Mi 和 M: 都 接受 这 个 字符 串 ， 因 此 产生 的 语言 是 交集 ， 而 不 是 并 集 。 事 实 上， 这 个 结果 证 明正 则 语言 类 在 交 
运算 下 封闭 。 
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号 s 的 箭头 。 一 般 地 说 ，NFA 的 箭头 可 以 标记 字母 表 中 的 符号 或 s。 从 一 个 状态 可 能 射出 
0 个 、1 个 或 多 个 和 带 有 标号 Wark. 

NFA 如 何 进行 计算 ?假设 一 台 NFA 正在 对 一 个 输入 串 运 行 ， 它 能 以 多 种 行进 方式 到 
达 一 个 状态 。 例 如 ，NFA Ni 处 于 状态 g/ ， 下 一 个 输入 符号 是 1。 在 读 入 这 个 符号 后 ， 机 
器 把 自己 复制 成 多 个 备份 ， 并 且 并 行 地 执行 所 有 的 可 能 性 。 机 器 的 每 一 个 备份 采用 一 种 可 
能 的 方式 进行 ， 并 且 像 前 面 一 样 继续 下 去 。 如 果 随 后 又 有 多 种 选择 ， 机 上 需 将 再 次 分 裂 。 对 
于 机 器 的 一 个 备份 ， 如 果 下 一 个 输入 符号 不 出 现在 它 所 处 的 状态 射出 的 任何 租 凑 上， 则 机 
器 的 这 个 备份 及 其 相关 联 的 计算 分 支 一 块 死 掉 。 最 后 ， 如 果 机 器 的 某 一 个 备份 在 输入 的 末 
端 处 在 接受 状态 ， 则 这 台 NFA 接受 输入 字符 串 。 

如 果 遇 到 一 个 状态 ， 在 射出 的 箭头 上 标 有 ss， 发 生 的 情况 类 似 。 不 用 读 任 何 输入 ， 机 
器 分 裂 成 多 个 备份 ， 每 一 个 标记 es 的 射出 箭头 有 一 个 备份 跟踪 ， 还 有 一 个 备份 停留 在 当前 
状态 。 然 后 机 器 和 前 面 一 样 非 确定 性 地 运行 。 

可 以 把 非 确定 性 看 作 是 若干 独立 的 “过 程 ” 或 “线程 >， 即 能 同时 运行 的 一 类 并 行 计 
算 。 当 NFA 分 头 跟踪 若干 选择 时 ， 这 对 应 于 一 个 过 程 “ 分 叉 ” 成 者 干 子 过 程 ， 各 个 子 过 
程 分 别 地 进行 。 如 果 这 些 子 过 程 中 至 少 有 一 个 接受 ， 那 么 整个 计算 接受 。 

另 一 种 方法 是 把 非 确 定型 计算 看 作 一 棵 可 能 性 的 树 。 树 根 对 应 计算 的 开始 ， 树 中 的 每 
一 个 分 支点 对 应 计算 中 机 器 有 多 种 选择 的 点 。 如 果 计 算 分 支 中 至 少 有 一 个 结束 在 接受 状 
AS, WLR. WK 1- 15 所 示 。 

考虑 图 1- 14 给 出 的 NFA Ni 的 运行 。 图 1- 16 描绘 了 Ni 关于 输入 010110 的 计算 。 





确定 型 计算 非 确定 型 计算 
， 开始 3 
mM 
( Ee 
{ sn YY 
ee “ 接受 
图 1- 15 有 一 个 接受 分 支 的 确定 型 计算 和 非 确定 型 计算 图 1-16 Ni 关于 输入 010110 的 计算 


对 于 输入 010110， 从 起 始 状态 q 开始 ， 读 第 一 个 符号 0。 对 于 0， 从 ai 出 发 只 有 一 
个 地 方 能 去 ， 即 回 到 gq; ， 所 以 保持 不 动 。 接 着 读 第 二 个 符号 1。 对 于 1，g， 有 两 种 选择 : 
或 者 停留 在 9; ， 或 者 移 到 g, 。 对 非 确 定型 ， 机 器 分 裂 成 两 个 ， 分 头 跟踪 每 一 种 选择 。 为 
了 记 住 可 能 处 于 哪些 状态 ， 在 机 器 的 每 一 个 可 能 的 状态 上 放 一 个 手指 。 因 此 现在 把 手指 放 
在 状态 q Ag, 上 。 有 一 个 se 箭头 离开 状态 g, ， 故 机 器 再 次 分 裂 : 一 个 手指 留 在 o ， 另 一 
个 手指 移 到 q. MWE, Eq ，q Ma, 上 都 有 手指 。 

当 读 第 三 个 符号 0 时 ， 返 回来 看 每 一 个 手指 。g， 上 的 手指 保持 不 动 ，q 上 的 手指 移 
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到 q; ， 并 且 把 原来 在 g; 上 的 手指 拿 掉 。 原 来 在 gs 上 的 手指 没有 0 箭头 能 沿 着 走 ， 这 对 应 
一 个 完全 “ 死 掉 ” 的 过 程 。 此 时 ， 在 状态 g, Ma, 上 有 手指 。 

当 读 第 四 个 符号 1 时， 在 g, 上 的 手指 分 裂 成 在 状态 q ARE q 上 的 手指 ， 然 后 在 g， 
上 的 手指 进一步 分 裂 出 一 个 手指 沿 着 e 箭头 到 达 q, ， 而 在 qg 上 的 手指 移动 到 g, 。 现 在 在 
四 个 状态 上 都 有 手指 。 

和 读 第 四 个 符号 一 样 ， 当 读 第 五 个 符号 1 时 ， 在 q Ho, 上 的 手指 变 成 在 状态 g, ，g,， 
qs 和 9 上 的 手指 。 在 状态 g, 上 的 手指 被 移 开 ， 在 g, 上 的 手指 留 在 qg ERI. MEE q 
上 有 两 个 手指 ， 所 以 移 开 一 个 ， 因 为 在 此 刻 只 需要 记 住 qg 是 一 个 可 能 的 状态 ， 而 不 需要 
记 住 有 多 少 理 由 使 它 成 为 可 能 的 状态 。 

当 读 第 六 个 也 是 最 后 一 个 符号 0 时 ， 在 q 上 的 手指 原 地 不 动 ， 在 g, 上 的 手指 移 到 q, 
上 ， 移 开 原来 在 g, 上 的 手指 ， 在 g, 上 的 手指 留 在 原 地 不 动 。 现 在 已 经 到 达 字 符 串 的 末 
端 ， 如 果 有 某 只 手指 在 一 个 接受 状态 上 ， 则 接受 该 字符 串 。 现 在 ， 在 状态 q a 和 gq, 上 
都 有 手指 ， 由 于 g, 是 一 个 接受 状态 ， 所 以 Ni 接受 这 个 字符 串 。 

Ni 对 输入 010 做 些 什 么 ? 开始 时 把 一 个 手指 放 在 g, 上 。 读 0 之 后 仍然 只 在 gq, 上 有 一 
个 手指 ， 而 在 读 1 之 后 在 g, 、q, Ma, 上 有 手指 (不 要 忘记 箭头 )。 在 读 第 三 个 符号 0 之 
后 ， 移 开 qg 上 的 手指 ， 把 q 上 的 手指 移 到 qg 上 ,保留 g 上 的 手指 不 动 。 此 时 已 经 在 输 
入 串 的 末端 ， 由 于 在 接受 状态 上 没有 手指 ， 所 以 Ni 拒绝 这 个 输入 。 

继续 以 这 种 方式 试验 ， 可 以 发 现 Ni 接受 所 有 含 101 或 11 作为 子 串 的 字符 串 。 

非 确定 型 有 穷 自动 机 在 若干 方面 都 是 有 用 的 。 正 如 我 们 将 要 证 明 的 那样 ， 每 一 台 
NFA 都 可 以 转换 成 一 台 等 价 的 DFA， 而 构造 NFA 有 时 比 直 接 构造 DFA 容易 。 一 台 NFA 
可 能 比 与 它 等 价 的 DFA 小 很 多 ,或 者 它 的 功能 更 易于 理解 。 由 于 有 穷 自动 机 特别 容易 理 
解 ， 有 穷 自动 机 的 非 确定 性 也 是 对 能 力 更 强 的 计算 模型 的 非 确 定性 的 一 个 很 好 的 引入 。 现 
在 来 看 几 个 NFA 的 例子 。 

设 A 是 (0,1) 上 倒数 第 三 个 符号 为 1 的 所 有 字符 串 组 成 的 语言 (例如 ， 
000100 在 A 中 ,而 0011 不 在 A 中 )。 图 1-17 所 示 的 4- 状态 NFA N: 识别 A。 


No 


图 1-17 识别 A 的 NFA N: 


观察 这 台 NFA 的 计算 的 一 个 好 方法 是 让 它 停 在 起 始 状 态 qo BIE “TR” CIE 
位 于 倒数 第 三 的 位 置 上 。 这 时 ， 如 果 输 入 符号 
是 1， 那么 它 移 到 分 支 状态 g, ， 并 且 使 用 q, 和 
qi “验证 ” 它 的 猜想 是 否 正 确 。 

正如 前 面 讲 过 的 ， 每 一 台 NFA 都 可 以 转 
换 成 一 台 等 价 的 DFA， 不 过 有 时 那 台 DFA 的 
状态 可 能 会 多 很 多 。 关 于 语言 A 的 最 小 DFA 
含有 8 个 状态 。 而 且 可 能 发 现 ， 通 过 考察 图 1- 
18 中 的 DFA， 更 容易 理解 NFA 的 功能 。 图 1-18 一 台 识 别 A 的 DFA 
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假设 在 图 1- 17 的 机 器 No 中 ， 在 从 q, Blo, 和 从 q Ba, 的 箭头 上 的 标号 中 添加 eo 
亦 即 ， 这 两 个 箭头 的 标号 是 0、1、s， 而 不 仅仅 是 0、1。 在 做 了 这 样 的 改动 之 后 ，Ns 能 
识别 什么 样 的 语言 呢 ? 试 试 修改 图 1- 18 中 的 DFA， 使 它 也 能 识别 这 个 语言 。 æ 
CERD 考虑 图 1- 19 PH NFA Nas， 它 的 输入 字母 表 (0) 由 一 个 符号 组 成 。 只 含 一 
个 符号 的 字母 表 称 为 一 元 字母 表 (unary alphabet). 
这 台 机 器 说 明了 有 。 箭头 的 方便 之 处 。 它 接受 所 
有 形 如 0* 的 字符 串 ， 其 中 & 是 2 或 3 的 倍数 (注意 上 
标 表示 重复 ， 不 是 数值 的 指数 ) 。 例 如 ，Ns 接受 字符 
 ¢,00,000,0000 或 000000 ， 而 不 接受 0 和 00000, 
考虑 该 机 器 的 运行 方式 ;开始 时 猜想 是 要 验证 2 
的 倍数 还 是 3 的 倍数 ， 从 而 分 支 到 上 面 的 循环 或 下 面 
的 循环 ， 然 后 验证 猜想 是 否 正确 。 当 然 ， 可 以 用 一 台 
没有 *e 箭头 的 机 器 ， 甚 至 是 一 台 完 全 没有 任何 非 确定 
性 的 机 器 代替 这 人 台 机 器 。 但 是 ， 对 于 该 语言 这 台 机 器 
是 最 容易 理解 的 。 wi 
CRED 图 1-20 给 出 了 NFA 的 另 一 个 例子 。 
运行 这 人 台 机 器 ， 将 会 看 到 它 接受 字符 串 s，a，baba 
和 baa， 而 不 接受 字符 串 b, bb 和 babba, Æ Ja HR 
们 会 用 这 台 机 器 阐明 把 NFA 转换 成 DFA 的 过 程 m 


1.2.1 非 确 定型 有 穷 自动 机 的 形式 化 定义 


非 确定 型 有 穷 自 动机 的 形式 化 定义 和 确定 型 有 穷 
自动 机 的 形式 化 定义 类 似 ， 它 们 都 有 状态 集 、 输 入 字母 表 、 转 移 函 数 、 起 始 状 态 以 及 接受 状 
态 集 。 然 而 ， 它 们 在 本 质 上 是 不 同 的 一 一 转移 函数 的 类 型 不 同 。 在 DFA 中 ， 转 移 函 数 取 一 
个 状态 和 一 个 输入 符号 ， 产 生 下 一 个 状态 。 在 NFA 中 ， 转 移 函 数 取 一 个 状态 和 一 个 输入 符 
号 或 者 空 串 ， 产 生 可 能 的 下 一 个 状态 的 集合 。 为 了 书写 这 个 形式 化 定义 ， 需 要 引入 某 个 额外 
的 符号 ， 对 任意 的 集合 Q， 记 PQ 为 Q 的 所 有 子 集 组 成 的 集合 。 这 里 称 P(Q) EKA 
集 (power set)。 对 任意 的 字母 表 S， 把 3U {e} 记 作 5 。 现 在 可 以 容易 地 写 出 NFA 中 这 种 类 
型 的 转移 函数 的 形式 化 定义 ， 它 是 6:QX3 一 P(Q)。 下 面 给 出 NFA 的 形式 化 定义 。 

非 确 定型 有 穷 自 动机 是 一 个 5 元 组 (Q,5,6,g,,F)， 其 中 

1.Q 是 有 穷 的 状态 集 ; 

2.5 是 有 穷 的 字母 表 ; 

3.6:QX5. 一 P(Q) 是 转移 函数 ; 

4. qo EQ 是 起 始 状 态 ; 

5. FOQ 是 接受 状态 集 。 

回想 一 下 NFA Ni: 


0, 1 0, 1 


ry 





Æ 1-20 NFA N, 


RIF EAE 


WW 
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Ni 的 形式 化 描述 是 (Q,5,6,g, F), Hp 
1. Q ={g 95 rq G4} » 

2.2 ={0,1}, 

3.6 由 下 表 给 出 : 





4.q, 是 起 始 状 态 ， 

wF =i a 

NFA 计算 的 形式 化 定义 也 和 DFA 计算 的 形式 化 定义 类 似 。 设 N=(Q,3,0,q,F) 是 
一 台 NFA，w 是 字母 表 上 的 一 个 字符 串 。 如 果 能 把 w 写 成 ww 二 yi1y2…ym， 这 里 每 一 个 
yi ES 的 一 个 成 员 ， 并 且 存 在 Q 中 的 状态 序列 ro ,ri，… ,rm 满足 下 述 3 个 条 件 : 

i: a= Gh 

Ze Pepi EO Cris yiti) t=O, 1, =, m~] 

3. frm EF 
则 称 N Sw. 

条 件 1 说 机 器 从 起 始 状 态 开 始 。 条 件 2 说 状态 r E N ERS ri 读 到 yi+l 时 允许 
的 下 一 个 状态 。 注 意 到 8(ri ,yi+l) 是 允许 的 下 一 个 状态 的 集合 ， 所 以 mi+1 是 这 个 集合 的 
一 个 成 员 。 最 后 ， 条 件 3 说 如 果 最 后 的 状态 是 一 个 接受 状态 ， 则 机 器 接受 它 的 输入 。 


1.2.2 NFA 与 DFA 的 等 价 性 


确定 型 和 非 确定 型 有 穷 自动 机 识别 相同 的 语言 类 。 这 个 等 价 性 既 出 人 意料 、 又 是 有 用 
的 。 说 它 出 人 意料 是 因为 NFA 好 像 比 DFA 的 能 力 强 ， 因 此 猜想 NFA 能 够 识别 更 多 的 语 
。 说 它 是 有 用 的 是 因为 对 于 给 定 的 语言 ， 描 述 识别 这 个 语言 的 NFA 有 时 比 描述 识别 这 
个 语言 的 DFA 要 容易 些 。 

如 果 两 台 机 器 识别 同样 的 语言 ， 则 称 它 们 是 等 价 的 。 

EED 年 一 台 非 确定 型 有 穷 自 动机 都 等 价 于 某 一 台 确 定型 有 穷 自 动机 。 

证 明 思 路 ” 设 一 个 语言 被 一 台 NFA 识别 ， 那 么 必须 证 明 还 存在 一 台 DFA 也 识别 这 个 
语言 。 基 本 想法 是 把 NFA 转换 成 模拟 它 的 DFA. 

回想 设计 有 穷 自动 机 的 “读者 即 自动 机 ”策略 。 如 果 设 计 者 是 一 台 DFA， 会 怎样 模 
拟 这 台 NFA 呢 ? 在 处 理 输入 串 的 过 程 中 ， 需 要 记 住 什么 ? Æ NFA 的 几 个 例子 中 ， 在 输 
入 的 给 定点 把 手指 放 在 每 一 个 可 能 处 在 活动 的 状态 上 ， 用 这 种 方式 记 住 各 个 计算 分 文 。 
按照 NFA 的 运行 方式 移动 、 增 加 和 移 开 手指 。 需 要 记 住 的 全 部 信息 是 放 着 手指 的 状态 
的 集合 。 

设 & 是 NFA 的 状态 数 ， 则 它 有 2 个 状态 子 集 。 每 一 个 子 集 对 应 模拟 这 人 台 NFA 的 
DFA 必须 记 住 的 一 种 可 能 性 ， 所 以 这 台 DFA 将 会 有 2* 个 状态 。 还 需要 给 出 这 人 台 DFA 的 
起 始 状 态 和 接受 状态 以 及 它 的 转移 函数 。 引 入 一 些 形 式 化 记号 会 使 讨论 变 得 容易 些 。 
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证 明 设 N=(Q,3,6,qo，;F) 是 识别 语言 A 的 NFA， 要 构造 一 台 DFA M 识别 A。 在 
给 出 完整 的 构造 之 前 ， 先 考虑 比较 容易 的 情况 ,假设 N 没有 e 箭头 ， 以 后 再 把 e 箭头 考虑 
进来 。 

构造 一 台 识 别 语言 A 的 DFA M =Q, sgag F. 

1. Q'=P(Q). 

M 的 每 一 个 状态 是 NN 的 状态 的 一 个 集合 。P(Q) 是 Q 的 所 有 子 集 组 成 的 集合 。 

2. 对 于 REQ MaE, Fd (R,a) 二 {gE€EQ| 存 在 rER, 使 得 gE€E6(r,a)}。 如 果 尺 是 
M 的 一 个 状态 ， 则 它 是 NN 的 状态 的 一 个 集合 。 当 MERSER EAS aM, (Ra) 给 出 
a 把 R 中 的 状态 带 到 什么 地 方 。 由 于 每 一 个 状态 可 以 转移 到 一 个 状态 集合 ， 所 以 取 所 有 这 
些 集合 的 并 。 这 个 表达 式 可 以 用 另 一 种 方式 写成 3 (R,a)= Us(r,a) ' 记号 Uara) 的 


含义 是 : 对 R 中 的 所 有 元 素 r 集合 8(Cr',a) 的 并 集 。 

3. qo ={Qy}- 

M 开始 时 所 在 的 状态 对 应 于 只 含 N 的 起 始 状态 的 集合 。 

4. F={REQ |R BE N 的 一 个 接受 状态 } 

如 果 此 时 在 N 的 可 能 状态 中 有 一 个 接受 状态 ， 那 么 机 器 M 接受 。 

现在 考虑 s 箭头， 为 此 再 引入 一 位 记号 。 对 于 M 的 任意 一 个 状态 R， 定 义 E(R) 为 从 
R 的 成 员 出 发 只 沿 着 es 箭头 可 以 达到 的 状态 集合 ， 包 括 R 本 身 的 所 有 成 员 在 内 。 形 式 地 ， 
HTF REQ, + 

E(R) 二 (gq| 从 尺 出 发 沿 着 0 个 或 多 个 e 箭头 可 以 到 达 g) 
然后 修改 M 的 转移 函数 ， 使 得 在 每 一 步 之 后 ， 在 沿 着 es 箭头 可 以 达到 的 所 有 状态 上 也 放 上 
手指 。 用 EC(5(r,a)) 代替 6(r,a) 能 产生 这 个 效果 。 于 是 
e (R,a) 二 {gEQ| 存 在 rER, 使 得 qE E(6(r,a))) 

此 外 还 需要 修改 M 的 起 始 状态 ， 使 得 开始 时 把 手指 移 到 从 N 的 起 始 状态 出 发 沿 着 s 
箭头 可 以 到 达 的 所 有 状态 上 。 将 go 改 成 E({gq,}) 能 产生 这 个 效果 。 这 样 就 完成 了 模拟 
NFA N 的 DFA M 的 构造 。 

M 的 构造 显然 是 正确 的 。 在 计算 的 每 一 步 ，M 进入 的 状态 明显 地 对 应 于 NN 此 时 可 能 
处 于 的 状态 子 集 。 证 毕 。 a 

定理 1.19 说 明 每 一 台 NFA 都 能 够 被 转换 成 一 台 与 其 等 价 的 DFA。 于 是 ， 非 确定 型 
有 穷 自动 机 给 出 男 一 种 刻画 正则 语言 的 方式 。 这 一 事实 陈述 为 定理 1. 19 的 一 个 推论 。 

一 个 语言 是 正则 的 ， 当 且 仅 当 有 一 台 非 确定 型 有 穷 自动 机 识别 它 。 

“ 当 且 仅 当 ”的 一 个 方向 是 说 ， 如 果 有 一 台 NFA 能 识别 这 个 语言 ， 则 它 是 正则 的 。 定 
理 1. 19 表明 ， 任 何 一 台 NFA 都 能 够 被 转换 成 一 台 等 价 的 DFA， 因 此 如 果 有 一 台 NFA 
别 这 个 语言 ， 那 么 也 有 一 台 DFA 识别 它 ， 从 而 这 个 语言 是 正则 的 。 另 一 个 方向 是 说 ， 仅 
当 有 一 台 NFA 识别 这 个 语言 时 该 语言 才 是 正则 的 。 即 ， 如 果 一 个 语言 是 正则 的 ， 则 一 定 
有 一 台 NFA 识别 它 ， 这 显然 成 立 ， 因 为 每 一 个 正则 语言 都 有 一 台 识 别 它 的 DFA， 而 任 一 
台 DFA 也 是 一 台 NFA. 

用 例 1. 16 中 的 机 器 Ns 来 说 明定 理 1. 19 给 出 的 把 NFA 转换 成 DFA 的 过 
fe. ATTRA. Æ N, 的 状态 重新 记 作 {1,2,3}。 于 是 ， 在 形式 化 描述 Ns = (Q, {a， 
b},6,1,{1}) 中 ， 状 态 集 Q 为 {1,2,3}， 如 图 1- 21 所 示 。 
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要 构造 与 N4 等 价 的 DFA D, KAHE DINKA. Ni 有 3 个 状态 {1,2,3}, WMA D 
有 8 个 状态 ， 每 一 个 状态 对 应 于 Ne 的 一 个 状态 子 集 。 把 了 的 每 一 个 状 
态 记 作 它 所 对 应 的 Na 的 状态 子 集 。 于 是 ， 的 状态 集 为 

(区 

其 次 ， 确定 D 的 起 始 状 态 和 接受 状态 。 起 始 状 态 是 EE({1})， 它 等 
于 从 1 出 发 沿 着 箭头 能 够 到 达 的 所 有 状态 加 上 1 本身。 有 一 个 s 箭 头 
从 1 到 3， 故 E((1}))= 二 (1,3)。 新 的 接受 状态 集 是 所 有 包含 Ns 接受 状 
态 的 状态 子 集 ， 即 {{1},{1,2},{1,3},{1,2,3}}. 

最 后 ， 确 定 万 的 转移 函数 。D 的 任 一 个 状态 遇 到 输入 a 时 转 到 一 个 地 方 ， 遇 到 输入 
时 转 到 一 个 地 方 。 用 几 个 例子 说 明 安 置 D 的 转移 箭头 的 过 程 。 

由 于 在 Ns 中 ， 状 态 2 遇 到 输入 a 时 转 到 2 和 3， 并 且 从 2 或 3 不 能 沿 着 se 箭头 走 得 更 
远 ， 所 以 在 DP, RA (2》 遇 到 输入 a 转 到 (2,3}。 在 N, 中， 状态 2 遇 到 输入 b 时 只 
能 转 到 状态 3， 并 且 不 能 从 3 沿 着 箭头 走 得 更 远 ， 所 以 在 D 中 ， 状 态 (2) eA dN 
转 到 状态 {3}. 

由 于 在 Na 中 没有 a 箭头 从 状态 (1) 射出 ， 所 以 在 D 中 状态 (1) BRA a EBS. 
状态 {1} 遇 到 输入 b 转 到 (2). EB. EM 1. 19 描述 了 跟随 每 一 个 输入 符号 后 的 。 箭头 
的 过 程 。 另 一 种 基于 在 每 一 个 输入 符号 之 前 跟随 s 箭头 的 过 程 也 行 之 有 效 ， 但 没有 在 该 例 
中 演示 。 

由 于 在 Ns 中 状态 3 遇 到 输入 a 时 转 到 1， 并 且 1 又 沿 着 es 箭头 回 到 3， 所 以 状态 {3} 
遇 到 输入 a 时 转 到 {1,3}， 遇 到 输入 b NHS. 

因为 1 没有 用 a 箭头 指向 任何 状态 ，2 用 a 箭头 指向 2 和 3， 并 且 2 和 3 都 没有 用 s 箭 
头 指向 任何 地 方 ， 所 以 状态 {1,2) 遇 到 输入 a 时 转 到 {2,3}。 状 态 {1,2} 遇 到 输入 b 时 
转 到 {2,3}。 继 续 按 照 这 个 方式 进行 ， 可 以 得 到 D 的 状态 图 ， 如 图 1- 22 所 示 。 





图 1-21 NFA N, 





图 1-22 5 NFA Ns 等 价 的 DFA D 


通过 观察 到 没有 箭头 射 人 的 状态 (1) 和 {1,2)， 可 以 对 这 人 台 机 器 进行 简化 ， 删 掉 这 
两 个 状态 不 会 影响 机 器 的 性 能 。 这 样 做 可 以 得 到 图 1- 23。 





图 1-23 删 掉 不 需要 的 状态 后 得 到 的 DFA D om 
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1.2.3 在 正则 运算 下 的 封闭 性 


现在 回 到 在 1. 1 市 中 开始 的 正则 语言 类 在 正则 运算 下 的 封闭 性 ， 目 标 是 证 明正 则 语言 
在 经 过 并 、 连 接 以 及 星 号 运算 后 仍 是 正则 语言 。 当 时 由 于 处 理 连接 运算 太 复 杂 ， 放 弃 了 证 
明 的 打算 。 使 用 非 确 定性 能 使 证 明 容易 许多 ，。 

首先 ， 再 次 考虑 在 并 运算 下 的 封闭 性 。 前 面 在 证 明 并 运算 下 的 封闭 性 时 ， 使 用 笛 卡 
尔 积 构造 的 同时 ， 非 确定 性 地 模拟 了 两 台 机 器 。 现 在 用 一 个 新 的 证 明 来 说 明 非 确定 性 技 
术 。 重 新 看 看 原来 在 1. 1.5 中 的 证 明 可 能 是 值得 的 ， 这 能 够 让 发 现 新 的 证 明 容 易 、 直 观 
许多 。 

GERED 正则 语言 类 在 并 运算 下 封闭 。 

证 明 思 路 有 两 个 正则 语言 Ai 和 As*, ， 要 证 明 Ai UA: 是 正则 的 。 想 法 是 对 Al M A? 
WAS NFA Ni 和 Nz， 并 把 它们 合并 成 一 台新 的 NFA N. 

当 Ni 或 No 接受 输入 时 ， 机 器 N 应 该 接受 这 个 输入 。 新 机 器 有 新 的 起 始 状 态 ， 它 用 
e 箭头 分 支 到 原 机 器 的 起 始 状态 。 新 机 器 用 这 种 方式 非 确定 性 地 猜想 两 台 原 有 机 器 中 哪 一 
台 接 受 这 个 输入 。 如 果 它 们 两 台中 有 一 台 接 受 ， 那么 N 也 接受 。 

图 1- 24 给 出 了 这 个 构造 。 在 图 的 左 部 ， 大 圆圈 表 
示 机 器 Ni 和 No 的 起 始 状 态 以 及 接受 状态 ， 小 圆圈 表 
示 其 余 的 状态 。 在 图 的 右 部 ， 说 明了 如 何 通 过 增加 转 
移 箭 头 把 Ni 和 N: 合并 成 N。 

证 明 Ni = (Qi 3.0159, Fi) WE AL, FF 
Nz 二 (Qz ,2,62 ,9,，F2) 识别 As， 构 造 识 别 Ai U A2 
的 N=(Q,35,05q)>F). 

1.Q={q,}UQ: UQ:. 

NN 的 状态 是 Ni AN: 的 所 有 状态 ， 再 加 上 一 个 新 
的 起 始 状态 qu 。 

2. 状态 qo。 EN 的 起 始 状 态 。 

3. 接受 状态 F=F UF. 

N 的 接受 状态 是 Ni 和 N: 的 所 有 接受 状态 。 因 此 ， 只 要 Ni 接受 或 N KZ, NK 





1-24 识别 AlUA;: 的 
NFA N 的 构造 


接受 。 
4. EM OME: 对 每 一 个 6EQ 和 每 一 个 zcE 瑟 ， 
01(g,a) qEQı 
O2(q,a) gE 
(dind?) @=q Ba=e 
D q= qy Hate tt 
现在 证 明正 则 语言 类 在 连接 运算 下 的 封闭 性 。 回 想 早 些 时 候 在 没有 非 确 定性 的 情况 
下 ， 要 完成 这 个 证 明 是 有 一 定 困 难 的 。 
正则 语言 类 在 连接 运算 下 封闭 。 
证 明 思 路 有 两 个 正则 语言 A1 MA, WEH A ° A 是 正则 的 。 想 法 是 取 两 台 NFA 
Ni 和 No 分别 识别 Al 和 A ， 像 在 证 明 并 运算 封闭 时 所 做 的 那样 ， 把 它们 合并 成 一 台新 


0(q;a) aes 
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的 NFA N, 但 是 这 一 次 要 用 不 同 的 方式 ， 如 图 1-25 所 示 。 

取 六 的 起 始 状 态 为 Ni 的 起 始 状 态 。Ni 的 N, 
每 一 个 接受 状态 增加 一 个 es 箭头 ， 使 得 只 要 Ni > © 
在 一 个 接受 状态 ， 就 允许 N 非 确定 性 地 分 支 进 和 ”9 oo Q| PO 
Niz 。 这 意味 着 它 已 经 找到 输入 的 前 一 段 ， 这 一 段 
构成 Ai 中 的 一 个 字符 串 。NN 的 接受 状态 就 是 NN， 
的 接受 状态 。 因 此 当 输 入 可 以 被 分 成 两 段 并 且 第 
一 段 被 Ni 接受 ， 第 二 段 被 N 接受 时 ，NN 接受 。 
可 以 认为 N 非 确 定性 地 猜想 在 什么 地 方 把 输入 串 
分 开 。 图 1-25 识别 A1。A; 的 NN 的 构造 

WEAR iN =(Qi,2501,9¢,>Fi1) We AL, 并且 Nz 二 (Qz ,5,62,g,，F2) 识别 Az， 构 
造 识别 A ° Az: 的 N==(Q,5,6,g] ,F;)。 

1. Q=Q Us. 

N 的 状态 是 Ni MN: 的 所 有 状态 。 

2. N 的 起 始 状态 是 Ni 的 起 始 状 态 q 

3. N 的 接受 状态 集 是 Ne 的 接受 状态 集 Fi. 

4. EM SOME: 对 每 一 个 gEQ 和 每 一 个 Es 





01 (qa) qEQ Hg€Fi 
01 (q.a) qe Fi H axe 
al ôi (qa) U {q} gE Fi Ha=e 
02 (qsa) qEQ? = 


正则 语言 类 在 星 号 运算 下 封闭 。 

证 明 思 路 有 一 个 正则 语言 A1， 要 证 明 
Ay 也 是 正则 的 。 取 一 台 识 别 A 的 NFA Ni， 
如 图 1- 26 所 示 的 那样 修改 它 ， 使 其 识别 AY 。 
只 要 能 把 输入 分 成 若干 段 ， 并 且 Ni 接受 每 一 
段 ， 则 修改 后 的 NFA N 就 接受 这 个 输入 。 

可 以 这 样 构造 N; 在 Ni 上 添加 从 每 一 个 接 1-26 Rall Ar BN A 
受 状态 返回 起 始 状 态 的 。 箭头。 这样 ， 当 进行 到 Ni 能 接受 的 一 段 结束 时 ， 机 器 N 可 以 选 
择 跳 回 起 始 状态 试图 读 Ni 能 接受 的 下 一 段 。 此 外 还 必须 修改 N 使 其 接受 。 ，e 永远 是 AY 
的 成 员 。 一 个 (不 太 好 的 ) 想法 是 直接 把 起 始 状 态 加 到 接受 状态 集中 。 这 个 方法 确实 把 e 
加 进 了 被 识别 的 语言 中 ， 但 是 它 也 可 能 加 进 一 些 其 他 不 想 要 的 字符 串 。 练 习 1. 15 要 求 给 
出 一 个 说 明 这 个 想法 不 对 的 例子 。 解 决 这 个 问题 的 办 法 是 添加 一 个 新 的 起 始 状态 ， 同 时 也 
是 一 个 接受 状态 ， 并 且 有 一 个 指向 原 起 始 状态 的 es 箭头 。 这 个 解决 方案 能 达到 期 望 的 效 
果 : 在 识别 的 语言 中 加 入 e 而 不 加 入 其 他 任何 字符 串 。 

证 明 设 和 二 (Qi,3,601,91 Fi) 识别 Ai， 构造 识别 Ar 的 N=(Q,3,0,q)>F). 

I. R= (g) UQi« 

N 的 状态 是 Ni 的 所 有 状态 加 一 个 新 的 起 始 状态 qu 。 

2. qu 是 新 的 起 始 状 态 。 
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he F={g} UFi« 
接受 状态 是 原 有 接受 状态 加 新 的 起 始 状 态 。 
4 EM SOME: 对 每 一 个 gaEQ 和 每 一 个 gc 和 五 。 


01(q,a) qEQı H qẸFı 
01 (qsa) qe F, H afe 
0(q,a) = Si Cga Uig? gE Fi Ha=e 
{q,} g= A ae 
Ø q= qy H axe a 


1.3 正则 表达 式 


在 算术 中 可 以 用 运算 符 十 和 XX 来 构造 表达 式 ， 如 (5 十 3)X4。 类 似 地 ， 可 以 用 正则 运 

算 符 构造 描述 语言 的 表达 式 ， 称 为 正则 表达 式 。 例 如 : 
(OU 1)0* 

上 面 那 个 算术 表达 式 的 值 是 32， 而 正则 表达 式 的 值 是 一 个 语言 。 在 这 个 例子 中 ， 正 则 表达 
式 的 值 是 由 一 个 0 或 一 个 1 后 面 跟着 任意 个 0 的 所 有 字符 串 组 成 的 语言 。 仔 细 地 分 析 这 个 
表达 式 的 各 部 分 ， 可 以 得 到 这 个 结果 。 首 先 ， 符号 0 和 1 是 集合 (0) 和 {1} 的 缩写 ， 因 
此 (0U1) 就 是 ((0}U {1})。 这 部 分 的 值 是 语言 {0,1}。 第 2 部 分 0* 就 是 {0}* ， 它 的 
值 是 由 所 有 包含 任意 个 0 的 字符 串 组 成 的 语言 。 其 次 ， 和 代数 中 的 符号 X 一 样 ， 在 正则 表 
达 式 中 常常 省 略 连接 符 。。 因 此 ，(0U1)0* 实际 上 是 (0U1)。0* 的 缩写 。 连 接 运 算 把 来 
自 这 两 部 分 的 字符 串 接 在 一 起 得 到 整个 表达 式 的 值 。 

正则 表达 式 在 计算 机 科学 各 种 应 用 中 有 着 重要 的 作用 。 在 涉及 文本 的 应 用 中 ， 用 户 可 
能 要 搜索 满足 某 种 模式 的 字符 串 。 正 则 表达 式 提 供 了 描述 这 种 模式 的 有 力 方法 。 应 用 程序 
(如 UNIX 中 的 awk 和 grep)、 现 代 程 序 设 计 语 言 (如 Perl) 以 及 文本 编辑 器 都 提供 了 用 
正则 表达 式 描述 模式 的 机 制 。 

正则 表达 式 的 另 一 个 例子 是 

人 人 

它 从 语言 (0U1) 开始 ， 并 且 运 用 * 运算 。 这 个 表达 式 的 值 是 由 0 和 1 的 所 有 字符 串 组 成 
的 语言 。 夺 2 二 《40,1}， 则 可 以 用 3 作为 正则 表达 式 (0 U1) 的 缩写 。 更 一 般 地 讲 ， 设 了 
是 任意 的 字母 表 ， 正 则 表达 式 5 描述 该 字母 表 上 所 有 长 度 为 1 的 字符 串 组 成 的 语言 ， 
I 描述 该 字母 表 上 的 所 有 字符 串 组 成 的 语言 。 类 似 地 ，5* 1 是 包含 着 所 有 以 1 结尾 的 字 
符 串 的 语言 。 语 言 (05* )U (5*1) 由 所 有 以 0 开始 或 者 以 1 结尾 的 字符 串 组 成 。 Mf 

在 算术 中 ， 久 优先 于 十 的 意思 是 ， 当 要 在 十 和 X 中 进行 选择 时 ， 首 先 选 择 X 运 算 。 因 
此 ,在 2 十 3X4 中 先 做 3X4， 再 做 加 法 。 要 想 先 做 加 法 ， 必 须 加 括号 ， 得 到 (2 十 3) X4。 
在 正则 表达 式 中 ， 先 做 星 号 运算 ， 然 后 做 连接 运算 ， 最 后 做 并 运算 ， 除非 用 插 号 改变 这 种 
惯常 的 顺序 。 


1.3.1 正则 表达 式 的 形式 化 定义 


(ER 称 尺 是 一 个 正则 表达 式 ， 如 果 尺 是 
l. a， 这 里 a 是 字母 表 习 中 的 一 个 元 素 ; 


€; 

Ø ; 

. (Ri UR2), R8 R FR. 是 正则 表达 式 ; 
. (Ri ° R2), R8 R 和 Rs 是 正则 表达 式 ; 
. (Rr )， 这 里 R 是 正则 表达 式 。 

在 第 1 条 和 第 2 条 中 ， 正 则 表达 式 a 和 ge 分 别 表 示 语 言 la) 和 {e)}。 在 第 3 条 中 , E 
则 表达 式 纪 表示 空 语言 。 在 第 4、5、6 条 中 ， 正 则 表达 式 分 别 表示 语言 Ri 和 Rs 做 并 运算 
或 连接 运算 或 者 R 做 星 号 运算 得 到 的 语言 。 

不 要 混 消 正则 表达 式 s 和 名。 表达 式 。 表示 只 包含 一 个 字符 串 
表示 不 包含 任何 字符 串 的 语言 。 

表面 上 看 这 里 有 用 其 自身 定义 正则 表达 式 的 危险 。 要 是 果真 如 此 ， 那 么 这 是 一 个 循环 
定义 (circular defination), EK ETAK. BÆ, R MR. 总 是 比 R 小 ， 因 此 ， 实 际 上 
是 在 用 较 小 的 正则 表达 式 定 义 较 大 的 正则 表达 式 ， 从 而 避免 了 循环 。 这 种 类 型 的 定义 称 为 
归纳 定义 (inductive defination) 。 

表达 式 中 的 括号 可 以 略 去 。 如 果 略 去 括号 ， 计 算 按 照 下 述 优先 顺序 进行 : 星 号 ， 连 
接 ， 然 后 并 。 

为 便于 描述 将 RR* WER. RA, EFR 表示 由 0 个 或 多 个 R 中 的 串 连接 构 
成 的 所 有 串 ，R™ 表示 由 1 个 或 多 个 R PHPBB MMA. Ale R Ue=R*. E 
Sh, PER TSR 中 的 串通 过 连接 得 到 的 串 简 记 作 R*。 

当 想 要 明显 地 区 分 正则 表达 式 R 和 它 所 描述 的 语言 时 ， 把 R 描述 的 语言 写成 L(R)。 

在 下 面 的 例子 中 假设 字母 表 卫 是 (0,1). 

l. 0*10* = {wl w EHT 1). 

2 S 15* —{wlo EDAT 1}. 

3. 3*001S* ={wlw AFH 001}, 

4. 1* (017 )* ={w| w 中 的 每 一 个 0 后 面 至 少 跟 有 一 个 1}。 

5. (22)* ={(wlw 是 长 度 为 偶数 的 字符 串 } 昌 。 
6 
7 
8 
9 





空 串 的 语言 ， 而 2 


. (25353)* 二 {wl|w 的 长 度 为 3 的 整数 倍 )。 

. 01U10={01,10}, 

. 05* 0U13* 1U0U1== {wlw 以 相同 的 符号 开始 和 结束 )。 

E TOL =pl Lis , 

表达 式 0Ue 表示 语言 {0,e}， 因 此 连接 运算 把 0 或 e 加 在 1* 中 每 一 个 字符 串 的 前 面 。 
10. (OUe) (1Ue) = {e,0,1,01}, 


ll. 1* O=@. 

把 空 集 连 接 到 任何 集合 上 得 到 空 集 。 

12. O* —{e}. 

星 号 运算 把 该 语言 中 的 任意 个 字符 串 连接 在 一 起 ， 得 到 运算 结果 中 的 一 个 字符 串 。 如 
果 该 语言 是 空 集 ， 星 号 运算 能 把 0 个 字符 串 连 接 在 一 起 ， 得 到 唯一 的 空 串 。 if 


O 字符 串 的 长 度 是 指 它 含有 的 符号 的 个 数 。 
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若 设 RR 是 任意 的 正则 表达 式 ， 可 以 得 到 下 述 恒等式 。 它 们 能 很 好 地 检查 读者 是 否 理解 
了 正则 表达 式 的 定义 。 


RUØ=R 
把 空 语 言 加 到 任 一 其 他 语言 上 不 会 改变 这 个 语言 。 
Ree=R 


把 空 串 加 到 任 一 字符 串 上 不 会 改变 这 个 字符 串 。 

但 是 ， 交 换 前 面 两 个 恒等式 中 的 名 和 8 可 能 导致 恒等式 不 成 立 。 

RUe 可 能 不 等 于 R。 

例如 ， 如 果 R=0， 那么 L(R)=={0}, 而 L(RUe)=={0,e)。 

Reo OA RAS F R. 

例如 ; we R=0, ABA LCR)={0}, M L(R°D)=@, 

在 设计 程序 设计 语言 的 编译 程序 中 ， 正 则 表达 式 是 个 很 有 用 的 工具 。 程 序 设计 语言 中 
的 基本 对 象 称 为 单字 (token) ， 如 变量 名 和 篆 量 ， 它 们 可 以 用 正则 表达 式 描 述 。 例 如 ， 可 
能 包括 小 数 部 分 和 (或) 正 负 号 的 数值 常量 可 以 描述 成 下 述 语言 的 一 个 成 员 

Cr UD: DUR. 2") 

其 中 D={0,1,2,3,4,5,6,7,8,9} 是 十 进 制 数字 字母 表 。 几 个 生成 的 字符 串 例 子 如 : 72, 
3. 14159, +7. F1—. 01. 

一 且 程 序 设 计 语 言 中 单字 的 语法 用 正则 表达 式 摘 述 出 来 ， 目 动 系统 便 能 够 生成 词法 分 
析 器 (lexical analyzer) ， 它 是 编译 程序 的 一 部 分 ， 用 来 在 开始 阶段 处 理 输入 程序 。 


1.3.2 与 有 穷 自 动机 的 等 价 性 


就 描述 能 力 而 言 正则 表达 式 和 有 穷 自 动机 是 等 价 的 。 这 个 事实 是 相当 出 乎 意料 的 ， 因 为 
表面 上 看 有 穷 自动 机 和 正则 表达 式 是 很 不 相同 的 。 然 而 ， 任 何 正则 表达 式 都 能 够 转换 成 能 识 
别 它 所 描述 语言 的 有 穷 自动 机 ， 反 之 亦 然 。 回 忆 一 下 正则 语言 是 有 穷 自动 机 识别 的 语言 。 

一 个 语言 是 正则 的 ， 当 且 仅 当 可 以 用 正则 表达 式 描述 它 。 

这 个 定理 有 两 个 方向 。 把 每 个 方向 叙述 成 一 条 单独 的 引 理 并 加 以 证 明 。 

如 果 一 个 语言 可 以 用 正则 表达 式 描述 ， 那 么 它 是 正则 的 。 

证 明 思 路 ”假设 正则 表达 式 R 描述 某 语言 A 。 要 说 明 怎 样 把 R 转换 成 一 台 识 别 A 的 
NFA, 根据 推论 1. 20， 如 果 一 台 NFA 识别 A， 则 A 是 正则 的 。 

证 明 把 RR 转换 成 一 台 NFA N。 考 虑 正则 表达 式 定义 中 的 6 种 情况 。 

1. R=a, X#Ha€>. MHA, LCR)={a}, FI NFA 识别 LCR): 


全 
注意 到 这 台 机 器 符合 NFA 的 定义 ， 但 不 符合 DFA 的 定义 ， 因 为 它 的 状态 不 是 对 每 一 
个 可 能 的 输入 符号 都 有 射出 的 箭头 。 当 然 这 里 也 能 够 给 出 等 价 的 DFA, GÆ, WEA 
NFA 就 可 以 了 ， 而 且 它 更 容易 描述 一 些 。 
形式 地 表示 ， N= ((qq sda) wd Gg 1 qs): 其 中 6 的 定义 如 下 : 者 7r 关 gj 或 bA~a, I) 


Cq sa) =(q,}50(r,d) =O. 
2. R=e, ABA LCR) ={e}. PIR NFA 识别 LCR): 


GIF EA B 


Wk 


41 


形式 地 表示 ，N=((ql Eqa D, RP MMAN r Alb, rb) =. 
3. R=Ø, WWA LR)=Ø. FIR NFA 识别 LCR): 


>) 


Fe Hh, N=({q}: 581:0), EFH r Mb, lr, b) =. 

4. RÆR UR: 

5. R=R, ° R? 

6. R=R,* 

对 后 3 种 情况 ， 使 用 正则 语言 类 在 正则 运算 下 封闭 的 证 明 中 所 给 出 的 构造 。 换 句 话 
说 ， 由 识别 R 和 R (在 情况 6 PAAR) 的 NFA 构造 出 关于 尺 的 NFA， 从 而 得 到 需 
要 的 NFA。 E 

这 就 结束 了 定理 1. 28 证 明 的 第 一 部 分 ， 给 出 当 且 仅 当 中 较 容易 的 方向 。 在 接着 证 明 
另 一 个 方向 之 前 ， 先 看 几 个 例子 ， 用 上 述 过 程 把 正则 表达 式 转换 成 NFA, 

分 若干 阶段 把 正则 表达 式 (abU a)* 转换 成 一 台 NFA。 从 最 小 的 子 表达 式 
到 大 一 点 的 子 表达 式 逐 步 建立 ， 直 至 获得 关于 原始 表达 式 的 NFA， 如 图 1- 27 所 示 。 注 意 
这 个 过 程 一 般 不 能 给 出 状态 最 少 的 NFA。 本 例 给 出 一 台 有 8 个 状态 的 NFA， 而 等 价 的 最 
小 NFA 只 有 2 个 状态 。 你 能 找 出 这 台 最 小 的 NFA 吗 ? 


a 
b >OQ>0 
a OO -O’O 


abUa 


(ab Ua)* 





图 1-27 根据 正则 表达 式 (abU a)* 构造 一 台 NFA a 


在 图 1- 28 中 ， 正 则 表达 式 (aUb) x aba 被 转换 成 一 台 NFA。 有 几 小 步 没 
有 在 图 中 给 出 。 a 
现在 回 到 证 明定 理 1. 28 的 另 一 个 方向 。 


:如 果 一 个 语言 是 正则 的 ， 则 可 以 用 正则 表达 式 描 述 它 。 
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a 一 (> 人 
b 
sx >Q 
aUb (3 
r Omaa ©) 
(aUb)* OE $ - e 
“ 


aba >O >O > OO OO 


(aUb)*aba 





图 1-28 根据 正则 表达 式 (CaUb) x aba 构造 一 台 NFA 


证 明 思 路 ”需要 证 明 : 如 果 语 言 A 是 正则 的 ， 则 有 一 个 正则 表达 式 描 述 它 。 由 于 A 
是 正则 的 ， 故 它 被 一 台 DFA 接受 。 下面 给 出 一 个 把 DFA 转换 成 等 价 的 正则 表达 式 的 


过 程 。 


这 个 过 程 分 两 部 分 ， 这 里 要 使 用 一 种 称 为 广义 非 确定 型 有 穷 自 动机 的 新 型 有 穷 自 动 
机 ， 简 记 作 GNFA。 首 先 说 明 如 何 把 DFA 转换 成 GNFA， 然 后 说 明 如 何 把 GNFA 转换 成 


正则 表达 式 。 


广义 非 确定 型 有 穷 目 动机 就 是 非 确定 型 有 穷 目 动机 ， 只 是 转移 箭头 可 以 用 任何 正则 表 


达 式 作 标 号 ， 而 不 是 只 能 用 字母 表 的 成 员 或 es 
作 标 号 。GNFA 读 输 入 符号 段 ， 而 不 必 像 普 
通 NFA 一 次 只 能 读 一 个 符号 。GNFA 读 一 段 
输入 符号 ， 沿 着 连接 两 个 状态 的 箭头 移动 ， 
这 段 输入 符号 正好 是 那个 箭头 上 的 正则 表达 
式 描 “ 述 的 一 个 字符 串 。GNFA 是 非 确定 性 的 ， 
从 而 可 能 有 好 几 种 不 同 的 方式 处 理 同一 个 输 
入 串 。 如 果 它 的 处 理 能 够 使 得 GNFA 在 输入 
结束 时 进入 一 个 接受 状态 ， 则 它 接受 它 的 输 
A. K 1-29 给 出 了 一 个 GNFA 的 例子 。 

为 方便 起 见 ， 要 求 GNFA 具有 符合 下 述 
条 件 的 特殊 形式 : 





图 1-29 一 台 广 义 非 确定 型 有 穷 自 动机 


。 起 始 状 态 有 射 到 其 他 每 一 个 状态 的 箭头 ， 但 是 没有 从 任何 其 他 状态 射 人 的 箭头 。 
。 有 唯一 的 一 个 接受 状态 ， 并 且 它 有 从 其 他 每 一 个 状态 射 人 的 箭头 ， 但 是 没有 射 到 
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任何 其 他 状态 的 箭头 。 此 外 ， 这 个 接受 状态 与 起 始 状 态 不 同 。 

。 除 起 始 状态 和 接受 状态 外 ， 每 一 个 状态 到 自身 和 其 他 每 一 个 状态 都 有 一 个 箭头 。 

能 够 很 容易 地 把 DFA 转换 成 这 种 特殊 形式 的 GNFA。 添 加 一 个 新 的 起 始 状态 和 一 个 
新 的 接受 状态 ， 从 新 起 始 状态 到 原 起 始 状态 有 一 个 s 箭 头 ， 从 每 一 个 原 接 受 状态 到 新 接受 
状态 有 一 个 s 箭 头 。 如 果 一 个 箭头 有 多 个 标记 (或 者 在 两 个 状态 之 间 有 多 个 方向 相同 的 稍 
头 )， 则 把 它 替 换 成 一 个 标记 着 原先 标记 的 并 集 的 箭头 。 最 后 ， 在 没有 和 泪 头 的 状态 之 间 添 
加 标记 包 的 箭头 。 最 后 一 步 不 会 改变 识别 的 语言 ， 因 为 标记 人 的 转移 永远 不 能 被 使 用 。 从 
现在 起 ， 假 设 所 有 的 GNFA 都 是 这 种 特殊 形式 的 。 

下 面 说 明 如 何 把 GNFA 转换 成 正则 表达 式 。 设 这 台 GNFA A k NARS. H F GNFA 
必须 有 一 个 起 始 状态 和 一 个 接受 状态 ， 并 且 这 两 个 状态 是 不 相同 的 ， 因 此 & 之 2。 如 果 k> 
2， 则 构造 一 台 有 & 一 1 个 状态 的 等 价 GNFA。 对 新 的 GNFA 重复 这 一 步骤 直至 把 它 化 简 
到 只 有 2 个 状态 。 当 =2 h AS GNFA 只 有 一 
个 从 起 始 状 态 到 接受 状态 的 箭头 。 这 个 箭头 的 标记 
就 是 等 价 的 正则 表达 式 。 例 如 ， 图 1- 30 中 给 出 了 
把 一 台 有 3 个 状态 的 DFA 转换 成 等 价 的 正则 表达 
式 的 各 个 阶段 。 

关键 的 步骤 是 当 &> 之 2 时 构造 等 价 的 少 一 个 状 





态 的 GNFA。 为 此 ， 挑 选 一 个 状态 ， 把 它 从 机 器 上 图 1-30 把 DFA 转换 成 正则 
删 掉 ， 并 且 修 改 留 下 来 的 部 分 使 其 仍然 识别 相同 的 表达 式 的 典型 阶段 


语言 。 可 以 挑选 任意 一 个 状态 ， 只 要 它 不 是 起 始 状态 或 接受 状态 ， 当 &> 之 2 时 ， 一 定 存在 
这 样 的 一 个 状态 。 把 这 个 被 删 去 的 状态 称 为 9,, 。 

删 去 9， 后 ， 要 修改 每 一 个 留 下 来 的 箭头 上 标记 的 正则 表达 式 。 新 标记 中 加 进 了 失去 
的 计算 ， 从 而 弥补 了 由 于 删 去 9， 带 来 的 损失 。 从 状态 a, 到 状态 的 新 标记 是 描述 使 机 器 
Ka, 直接 到 9 或 者 通过 g,, 到 g 的 所 有 字符 串 的 正则 表达 式 。 图 1- 31 说 明了 这 个 方法 。 


R, 
(a) (Ry) (Ro) *(R3) U (Ra) (4) 
R, e R, 
$ 


原 图 修改 后 
图 1-31 构造 等 价 的 少 一 个 状态 的 GNFA 


R, 


在 原 机 器 中 ， 如 果 
1. 从 q; 到 9 有 一 个 标记 为 Ri 的 箭头 ， 
2. 从 9， 到 它 自己 有 一 个 标记 为 Re 的 箭头 ， 
3. 从 qi 到 gq, 有 一 个 标记 为 Rs 的 箭头 ， 
4. Ka, Bq, 有 一 个 标记 为 R4 的 箭头 ， 
那么 在 新 机 器 中 ， 从 a Bla, 的 箭头 的 标记 为 
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CR,) CR2) * (R;3)U CR») 

对 从 任 一 状态 q; 到 任 一 状态 gq; (包括 aq; =¢ 在 内 ) 的 每 一 个 箭头 进行 这 样 的 改动 。 
新 的 机 器 仍然 识别 原来 的 语言 。 

证 明 现在 来 形式 地 实现 上 述 想 法 。 为 便于 证 明 ， 首 先 形式 地 定义 引入 的 新 型 自动 
机 。 除 转移 函数 外 ，GNFA 与 非 确定 型 有 穷 自动 机 类 似 。GNFA 的 转移 函数 的 形式 为 

O {decent 12% (QO lamn OR 

符号 及 是 字母 表 三 上 的 全 体 正 则 表达 式 组 成 的 集合 ，qss 和 go 分别 是 起 始 状 态 和 接受 
状态 。 如 果 6(g,,g;) 二 R， 则 从 状态 q; 到 状态 gq; 的 箭头 以 正则 表达 式 尺 作为 它 的 标记 。 转 
移 函 数 的 定义 域 为 (Q 一 {qsoe))X(CQ 一 (st))， 这 是 因为 除了 gs 没有 射出 的 箭头 和 
qi 没有 射 人 的 箭头 ， 每 一 状态 到 另 一 状态 都 有 一 个 箭头 连接 。 

广义 非 确定 型 有 穷 自 动机 (QE drda’ Teco) 是 一 个 5 元 组 ， 其 中 : 
. Q 是 有 穷 的 状态 集 。 
. 王 是 输入 字母 表 。 
: DCA ln XO lin DMR ERBAK. 
.9 是 起 始 状态 。 
qaccept 是 接受 状态 。 

如 果 字 符 串 w 可 写成 二 wi wee wi， 这 里 每 一 个 w; E33* ， 并 且 存 在 状态 序列 gq» 
QoQ (EE: 

Le dy = astan ERA o 

2. gi 二 qsccemt 是 接受 状态 。 

3. 对 每 一 个 各 EECR HH R= ds BR 是 从 -i 到 去 HARE 
表达 式 。 
则 称 这 台 GNFA 接受 字符 串 w. 

现在 回 到 引 理 1. 32 的 证 明 。 设 DFA M 识别 语言 A。 通 过 添加 一 个 新 的 起 始 状 态 、 一 个 
新 的 接受 状态 以 及 一 些 必 要 的 转移 箭头 ， 把 M 转换 成 一 台 GNFA G。 过 程 CONVERT(G) 
取 一 台 GNFA 作为 输入 ， 返 回 一 个 等 价 的 正则 表达 式 。 该 过 程 采 用 递归 方式 ， 即 它 要 调 
用 它 自 己 。 由 于 该 过 程 只 是 在 要 处 理 少 一 个 状态 的 GNFA 时 才 调 用 它 自 己 ， 故 不 会 出 现 
无 穷 循 环 。 当 GNFA 只 有 两 个 状态 时 ， 就 用 非 递 归 的 方式 进行 处 理 。 

CONVERT(G): 

1. 设 & 是 G 的 状态 数 。 

2. WẸ k=2, M G 一 定 是 由 一 个 起 始 状态 、 一 个 接受 状态 和 连接 这 两 个 状态 的 箭头 
组 成 ， 设 箭头 上 的 标记 为 正则 表达 式 R。 

返回 这 个 表达 式 R. 

3. 如 果 & 之 2， 则 任 取 一 个 状态 gi, EQ 一 {qson qaceept}， 并 且 令 G 为 GNFA(Q ,3,6 ， 
Gout? Tce) 6 FOP 


Ol e WwW N e 


Q =Q- (qa? 
并 且 对 每 一 个 wEQ - (luen? 和 每 一 个 oEQ -ilan > 
8’ (q; sq, = (Ri) (Rs)* (Rs) U Ra) 
HP Ri =8(q; dyin) > Re =OCQzip + Grip) » Rs =OCq,i, ,9;) 及 Ra =8(G; +9;) 


IÈ EMER 
4. 计算 CONVERT(G’) 且 返 回 这 个 值 。 
下 面 证 明 CONVERT(G) 返回 的 值 是 正确 的 。 
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对 任意 的 GNFA G, CONVERT(G) 等 价 于 G. 


符 串 。 因 而 这 个 表达 式 等 价 于 G. 


为 真 。 首 先 ， 证 明 G 和 G 识别 相同 的 语言 
分 支 中 ，G 依次 进入 下 列 状态 : 


归纳 基础 : 证 明 对 于 二 2， 断 言 为 真 。 铬 G 只 有 2 个 状态 ， 它 只 可 能 有 1 个 箭头 ， 从 
归纳 步骤 : 假设 断言 对 于 & 一 1 个 状态 为 真 ， 利 用 这 个 假设 ,证 明 对 于 & 个 状态 断言 


起 始 状态 到 接受 状态 。 这 个 箭头 上 标记 的 正则 表达 式 描 述 了 能 使 G 到 达 接 受 状 态 的 全 部 字 


dstart ? J1 292 93 9° 
WMR qu 


假设 G 接受 输入 w， 那 么 在 计算 的 一 个 接受 

”ydaccept 
如 果 被 删 去 的 状态 qi;, 不 在 这 些 状态 中 ， 则 显然 G 也 接受 w。 这 是 因为 标记 G 的 箭头 
的 每 一 个 新 正则 表达 式 包含 原 有 正则 表达 式 作 为 并 集 的 一 部 分 。 


出 现在 这 些 状 态 中 ， 则 删 去 这 个 状态 序列 中 所 有 的 g,;,， 得 到 G 的 一 个 接受 
RE G 中 使 q; 经 过 gj 到 qi 的 所 有 字符 串 。 因 此 G 接受 
WwW o Tj G 和 G 等 价 。 


计算 。 设 状态 w% Ma 之 间 夹 着 若干 个 连续 的 gap ， 则 它们 之 间 的 箭头 上 的 新 正则 表达 式 描 


ZW 
另 一 方面 ， 假 设 G 接受 输入 w。 由 于 GG 中 任意 两 个 状态 gq; Ala, 之 间 箭 头 上 的 正则 表 
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达 式 描述 在 G 中 使 g; 直接 或 经 过 gq,;, 到 达 g, 的 所 有 字符 串 组 成 的 集合 ， 故 G 也 一 定 接受 


这 就 完成 了 断言 1. 34、 引 理 1. 32 和 定理 1. 28 的 证 明 。 
的 2- 状态 DFA 开始 。 


归纳 假设 表明 ， 当 算法 对 输入 G 递归 地 调用 它 自己 时 ， 由 于 G 有 有 & 一 1 个 状态 ， 因 此 
得 到 一 个 等 价 于 C 的 正则 表达 式 ， 从 而 这 个 正则 表达 式 也 等 价 于 G， 得 证 算法 是 正确 的 。 


在 本 例 中 ， 运 用 上 面 的 算法 把 DFA 转换 成 正则 表达 式 。 从 图 1- 32(a) 中 
在 图 1- 32(b) 中 ， 通 过 添加 一 个 新 的 起 始 状态 和 一 个 新 的 接受 状态 ， 得 到 一 台 4- 状 


态 的 GNFA。 把 gst 和 gccort 分 别称 为 s 和 a， 这 样 画 起 来 方便 些 。 为 避免 把 图 搞 得 乱 七 八 
糟 ， 没 有 画 出 标记 为 儿 的 箭头 ， 尽 管 图 中 确实 有 这 样 的 第 头 。 注 意 ， 在 DFA 中 状态 2 的 
环 上 标记 a、b， 在 GNFA 中 对 应 处 被 替换 成 标记 aUb。 这 样 做 是 因为 DFA 中 的 标记 代 
表 2 个 转移 ， 一 个 对 应 a， 另 一 个 对 应 b， 而 GNFA 只 能 有 一 个 从 2 到 它 自 映 的 转移 。 


ATK 


在 图 1- 32(c) 中 ， 删 去 状态 2， 修 改 留 下 的 箭头 上 的 标记 。 这 次 只 有 一 个 标记 要 改变 ， 
aUJb，Rs 二 e 及 RR 二 名 。 因 此 ， 从 1 到 4a 的 箭头 上 的 新 标记 是 (b) (aUb) x US. KF 


ERM 1 到 a 的 标记 。 在 图 b) PERO, MEA (c) 中 是 b (aUb)* 。 根 据 过 程 CON- 
VERT 的 步骤 3 得 到 如 下 结果 : 状态 g; 是 状态 1， 状 态 9 ea, Mig, 2, W R =b, R= 
正则 表达 式 可 简化 成 blaUb)*。 


在 图 1- 32(d) 中 ， 删 去 图 (0 PRA], FHARBARHAREAA. AFTRA 
下 起 始 状 态 和 接受 状态 ， 因 此 连接 它们 的 箭头 上 的 标记 就 是 等 价 于 原 DFA 的 正则 表 
图 1-33 Bra. 


本 例 从 一 台 3- 状 态 的 DFA 开始 ， 转 换 成 等 价 的 正则 表达 式 的 步骤 如 


a*b(a U b)* 


(d) 








g 
(baUa) (aaUb)*ab U bb 





(d) 
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(a(aa U b)*ab U b)((ba U a)(aa U b)*ab U bb)*((ba U a)(aa U b)* Ue) Ua(aa U b)* 
(e) 


图 1-33 把 一 台 3- 状 态 的 DFA 转换 成 等 价 的 正则 表达 式 


1.4 非 正 则 语言 


要 了 解 有 穷 目 动机 的 能 力 ， 必 须 同时 了 解 它们 的 局 限 性 。 这 一 节 将 讲述 如 何 证 明 某 些 
语言 不 可 能 用 有 穷 目 动机 识别 。 

设 语 言 B=({(0"1"|n>0}, WMRBR-BiRG BH DFA, 会 发 现 这 台 机 器 看 起 来 需要 
记 住 至 此 它 在 输入 中 读 到 了 多 少 个 0。 由 于 0 的 个 数 没有 限制 ， 因 此 机 器 将 不 得 不 记 住 无 
穷 多 个 可 能 。 但是， 用 有 穷 个 状态 不 可 能 做 到 这 一 点 。 

下 面 给 出 一 种 方法 ， 用 来 证 明 像 B 这 样 的 语言 不 是 正则 的 。 由 于 0 的 个 数 没 有 限制 ， 
上 面 给 出 的 论证 不 是 已 经 证 明了 B 的 非 正则 性 了 吗 ? 非 也 。 这 些 看 起 来 需要 无 穷 存储 的 语 
言 并 不 意味 着 一 定 需 要 无 穷 的 存储 。 语 言 B 确实 是 非 正 则 的 ， 但 是 另外 一 些 语言 看 起 来 也 
需要 无 穷 多 个 可 能 ， 而 实际 上 却 是 正则 的 。 例 如 ， 考 虑 字母 表 3=={0,1} 上 的 两 个 语言 : 
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C=(wlw 0 All 的 个 数 相 等 }， 

D=({w|w 中 01 和 10 作为 子 串 出 现 的 次 数 相 同 } 

初 看 一 下 ， 识 别 这 两 个 语言 的 机 器 都 需要 计数 ， 因 而 好 像 都 不 是 正则 的 。 正 如 所 预料 
的 那样 C 不 是 正则 的 ， 但 令 人 吃惊 的 是 ， 是 正则 的 9 ! 可 见 直 觉 有 时 可 能 会 把 我 们 带 人 
皮 途 。 这 就 是 为 什么 想当然 的 事情 还 需要 数学 证 明 。 本 节 将 说 明 如 何 证 明 某 些 语言 不 是 正 
则 的 。 


关于 正则 语言 的 泵 引 理 


证 明 非 正则 性 的 技术 源 于 一 个 关于 正则 语言 的 定理 ， 通 常 把 它 称 为 泵 引 理 (pumping 
lemma) 。 该 定理 指出 所 有 的 正则 语言 都 有 一 种 特殊 的 性 质 。 如 果 能 够 证 明 一 个 语言 没有 
这 种 性 质 ， 则 可 以 保证 它 不 是 正则 的 。 这 条 性 质 是 : 语言 中 的 所 有 字符 串 只 要 它 的 长 度 不 小 
于 某 个 特定 的 值 一 一 泵 长 度 (pumping length)， 就 可 以 被 “抽取 ”。 它 的 意思 是 指 每 一 个 这 
样 的 字符 串 都 包括 一 段子 串 ， 把 这 段子 串 重复 任意 次 ， 得 到 的 字符 串 仍 在 这 个 语言 中 。 

(RIR) ”车 A 是 一 个 正则 语言 ， 则 存在 一 个 数 p RKE) 使 得 ， 如 果 s 
是 A 中 任 一 长 度 不 小 于 pp 的 字符 串 ， 那 么 s 可 以 被 分 成 3 段 ，s 二 Tyz， 满 足下 述 条 件 : 

1. 对 每 一 个 i>0, xry'izEA 

Bs. | eb 0 

3. |zy|<p 

回忆 一 下 这 里 用 的 记号 ，| * | 表示 字符 串 s HKE, y 是 i 个 y 连接 在 一 起 ，y? 等 
T Ee 

A s 被 划分 成 xyz 时 ，z 和 zx 可 以 是 se， 但 是 条 件 2 说 y 关 e。 可 以 看 到 如 果 没 有 条 件 
2， 定 理 显然 成 立 ， 但 也 就 没有 什么 意思 了 。 条 件 3 说 x 和 yy 两 段 在 一 起 的 长 度 不 超过 之 。 
这 是 一 个 额外 的 技术 条 件 ， 偶 尔 会 发 现 它 在 证 明 语 言 的 非 正 则 性 时 是 有 用 的 。 关 于 条 件 3 
的 应 用 见 例 1. 39 。 

证 明 思 路 iw M=(Q,5,0,.¢,,F) 是 识别 A 的 DFA. CREE p SFM 的 状态 数 。 
要 证 明 A 中 任意 长 度 不 小 于 p 的 字符 串 s 可 以 划分 成 3 段 zyz， 且 满足 定理 中 的 3 个 条 
件 。 如 果 在 A 中 没有 长 度 不 小 于 p 的 字符 串 怎 么 办 ? 这 时 工作 就 更 容易 了 ， 因 为 定理 显 
RRL: 如 果 没 有 这 样 的 字符 串 ， 则 显然 对 所 有 这 样 的 字符 串 ，3 个 条 件 都 成 立 。 

E s€EA 的 长 度 不 小 于 p， 考 虑 M 对 输入 的 计算 中 经 过 的 状态 序列 。 它 从 起 始 状态 
q 开始 ， 然 后 到 gs; ， 到 aq, ， 再 到 q ， 等 等 ， 一 直到 s 结束 进入 状态 qlj; 。 由 于 属于 A， 
M 接受 ss， 因此 gj, 是 一 个 接受 状态 。 

E 5 的 长 度 为 nx， 则 状态 序列 gj ,qs doo a KRENA ntl, Hn RANT 
p. 故 n 十 1 大 于 M 的 状态 数 p。 因 此 ， 在 这 个 序列 中 一 定 有 重复 出 现 的 状态 ， 这 个 结 
i E #8 SRB (pigeonhole principle) 的 一 个 例子 。 这 个 奇特 的 名 字源 于 下 述 很 明显 的 
事实 : MRE pA BRAGA, MARMANT p, MEARKE ALEA 1 
ABT. 

图 1-34 给 出 字符 串 s 和 M 在 处 理 * 时 经 过 的 状态 序列 。 状 态 gq, 重复 出 现 。 


© 见 问题 1.53。 
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S= Sı So & $5 S vs S, 
下 ra 
% 4% Yn In ds ds di 

图 1-34 说 明 当 M 读 s 时 状态 gs 重复 的 例子 


现在 把 * 划分 成 三 段 -，y 和 xz。z 是 :在 gq, 前 面 的 部 分 ，y 是 两 个 gq, 之 间 的 部 分 ，z 
E s 的 剩余 部 分 ， 即 第 二 个 gq 以 后 的 部 分 。 因 此 ,， x 把 M 
从 状态 gi 带 到 g,，y 把 M Mg EAR g, zM 从 ao 带 
到 接受 状态 qo WA 1- 35 所 示 。 

现在 来 看 看 为 什么 这 样 划 分 能 满足 规定 的 3 个 条 
件 。 假 设 对 输入 zyyz 运行 M。 已 知 z 把 M 从 ai Fl gq,» 
然后 第 一 个 y 把 它 从 gq, 带 回 到 g,。， 第 二 个 y 也 同样 把 它 
Ma, 带 回 到 g,。 ， 接 着 z WEERA qg. BF gi; 是 一 个 接 
受 状态 ， 故 M 接受 输入 zyyz。 类 似 地 ， 对 于 任意 i>0， 图 1 35 WAFER r, yM 
它 将 接受 zyiz。 当 i 二 0 时 ，zyiz= zz， 根 据 类 似 的 理由 人 
它 也 被 M 接受 。 这 就 证 实 了 条 件 1. 

由 于 y 是 * 在 状态 as。 出现 的 两 个 不 同 地 点 之 间 的 部 分 ， 故 可 以 看 到 |y| 盖 0。 这 就 验证 
TARE 2。 

为 了 使 条 件 3 成 立 ， 确 保 ge 是 序列 中 第 一 个 重复 的 状态 。 根 据 铝 梨 原理 ， 在 序列 的 前 
pp 十 1 个 状态 中 必定 有 重复 。 因 此 ，|zy| 委 z。 

证 明 it M=(Q,3,0,9,,F) 是 一 台 识 别 A 的 DFA, p 是 M 的 状态 数 。 

设 s 二 5152… sn 是 A 中 长 度 为 n 的 字符 串 ， 这 里 np., RB rise srai M 在 处 理 s 
的 过 程 中 进入 的 状态 序列 ， 因 而 rii =r si), 1 二 i 之 n。 该 序列 的 长 度 为 n 十 1， 不 小 于 
Pp 十 1。 根 据 饮 巢 原 理 ， 在 该 序列 的 前 p 十 1 个 元 素 中 ， 一 定 有 两 个 相同 的 状态 。 设 第 1 个 
是 r;， 第 2 个 是 x,:。 由 于 zi 出 现在 序列 的 前 pp 十 1 个 位 置 中 ， 而 且 序 列 是 从 ri 开始 的 ， 故 
有 /三 p 十 1。 此 时 , 令 工 二 51* $8j-19Y 二 $5j** 51-1 WR z=s1°** Sno 

由 于 x 把 M 从 nn tT Fl] Fj» yÆMM r; 市 到 Fj» z 728 MA r; H Fl] Fn+1» 而 ”+1 是 一 个 
接受 状态 ， 故 对 于 i>0, MHS zyz。 已 知 IAL, Mly|>0; RAMl<pt+l, Klryl<p. 
于 是 ， 满 足 泵 引 理 的 3 个 条 件 。 s 

为 了 运用 泵 引 理 证 明 某 个 语言 B 不 是 正则 的 ， 首 先 假设 B 是 正则 的 ， 以 便 得 出 矛盾 。 
根据 泵 引 理 ， 存 在 人 录 长 度 p 使 得 B 中 所 有 长 度 为 p 或 大 于 p 的 字符 串 都 可 以 被 抽取 。 其 
次 ， 在 B 中 寻找 一 个 字符 串 ;， 它 的 长 度 为 p 或 大 于 p、 但 不 能 被 抽取 。 最 后 ， 证 明 * 不 
能 被 抽取 。 这 要 考虑 把 s 划分 成 x、y 和 xz 的 所 有 方式 〈 如 果 方 便 的 话 ， 把 泵 引 理 中 的 条 
件 3 考虑 进来 ) ， 并 且 对 每 一 个 这 样 的 划分 ， 找 到 一 个 守 值 使 得 zyiz 华 召 。 在 做 这 最 后 一 步 
N, BRIER s 的 各 种 方式 分 成 若干 种 情况 ， 并 且 分 别 分 析 每 一 种 情况 。 如 果 B 是 正则 
的 ， 存 在 这 样 的 ;与 泵 引 理 了 矛盾。 因此 B 不 可 能 是 正则 的 。 

FR s 有 时 需要 点 创造 性 思维 。 在 找到 合适 的 s 之前， 可 能 需要 在 多 个 候选 中 和 仔细 搜 
R. 试验 B 中 那些 看 起 来 反映 了 B 的 非 正 则 性 “本 质 ” 的 成 员 。 后 面 的 一 些 例子 将 更 深 
人 地 讨论 寻找 s 的 方法 。 

Gee WR eB {(0"l"|\n>0}. HRS MUM B 不 是 正则 的 。 采 用 反 证 法 


M 





证 明 。 

假设 相反 ， 即 B 是 正则 的 。 令 p RHR BAKHRKE., Hs 为 字符 串 0*12 。 
因为 ;是 B 的 一 个 成 员 且 s 的 长 度 大 于 p， 所 以 泵 引 理 保证 s 可 以 分 成 3 段 ;二 zyz， 使 得 
对 于 任意 的 i>0, $ ryz 在 B 中 。 下 面 考虑 3 种 情况 ,说 明 这 个 结论 是 不 可 能 的 。 

1. FP y 只 包含 0。 在 这 种 情况 下 ， 字 符 串 zyyz 中 的 0 比 1 多 ， 从 而 不 是 B 的 成 
员 。 违 反 泵 引 理 的 条 件 1， 了 矛盾 。 

2. FRE y 只 包含 1， 这 种 情况 同样 给 出 矛盾 。 

3. 字符 串 y 既 包含 0 也 包含 1。 在 这 种 情况 下 ， 字 符 串 zyyz 中 0 和 1 的 个 数 可 能 相 
等 ， 但 是 它们 的 顺序 乱 了 ， 在 0 的 前 面 出 现 1]。 因 此 ，xzyyz 不 是 B 的 成 员 ， 了 矛盾 。 

这 样 ， 如 果 假 设 B 是 正则 的 ， 则 矛盾 是 不 可 避免 的 。 因 此 ，B 不 是 正则 的 。 注 意 ， 可 
以 通过 应 用 泵 引 理 的 条 件 3 来 排除 第 2 种 和 第 3 种 情况 ， 进 而 简化 该 证 明 。 

在 这 个 例子 中 ， 很 容易 找到 字符 串 ;s， 因 为 B 中 任何 长 度 为 p 或 大 于 上 p 的 字符 串 都 符 


合 要 求 。 在 下 面 两 个 例子 中 ，s 的 某 些 选择 是 行 不 通 的 ， 所 以 需要 额外 小 心 。 w 
设 C=(w|w 中 0 和 1 的 个 数 相同 }， 用 泵 引 理 证 明 C 不 是 正则 的 。 证 明 采 
用 反 证 法 。 


假设 相反 ， 即 C 是 正则 的 。 令 p 是 由 泵 引 理 给 出 的 泵 长 度 。 和 例 1. 38 一 样 ， 设 * 为 
字符 串 021r, Fs ECNH—-TRMRARERF p, R5l BRE s 可 以 分 成 三 段 :一 zyz， 
使 得 对 于 任意 的 ;之 0， 字 符 串 ryz 都 在 C 中 。 我 们 想 证 明 这 个 结果 是 不 可 能 的 。 可 是 稍 
等 一 下 ， 这 个 结果 是 可 能 的 ! WRO sc Me EZP, y EFE 012, M zyiz 中 0 和 1 
的 个 数 总 是 相等 的 ， 从 而 在 C 中 。 所 以 好像 是 可 以 被 抽取 的 。 

在 这 里 ， 有 泵 引 理 中 的 条 件 3 是 有 用 的 。 它 规定 在 抽取 s 时 ，s 必须 被 划分 使 得 |xy | 过 
力 。 这 样 就 限制 了 s 的 划分 方式 ， 使 得 能 够 比较 容易 地 证 明 所 选取 的 字符 串 ;二 0?1* 是 不 
可 能 被 抽取 的 。 如 果 | zy | <S, M y 一 定 只 由 0 组成， 从 而 zyyz 从 C。 因 此 不 可 能 被 
抽取 。 这 就 给 出 了 所 希望 的 矛盾 。 

在 这 个 例子 中 ， 选 取 字符 串 s 比 在 例 1. 38 中 需要 更 加 小 心 。 如 果 改 为 选择 ;二 (01)?， 
就 会 遇 到 肪 烦 。 因 为 所 需要 的 是 一 个 不 能 被 抽取 的 字符 串 ， 而 这 个 * 是 能 被 抽取 的 ， 甚 至 
把 条 件 3 考虑 在 内 也 能 被 抽取 。 想 一 想 如 何 抽取 它 ? 一 个 办 法 是 令 re, y=01 和 z= 
(01)2 1 。 那 么 对 于 ;的 每 一 个 值 ，zyizEC。 如 果 在 第 一 次 尝试 寻找 一 个 不 能 被 抽取 的 字 
RRNA MI, ABBR. HRM! 

已 知 B 是 非 正则 的 ， 由 此 可 以 得 到 男 一 个 证 明 C 是 非 正 则 的 方法 。 如 果 C 是 正则 的 ， 
则 CN0*1* 也 是 正则 的 。 理 由 是 语言 0* 1* 是 正则 的 ， 并 且 正 则 语言 类 在 交 运 算 下 封闭 
(在 1.1.5 节 的 脚注 中 证 明了 这 条 性 质 ) ， 但 是 C 门 0* 1* SFB, FAAP 1. 38 可 知 BE 
非 正 则 的 。 m 

设 F={ww|w€E {0,1)* }。 用 泵 引 理 说 明 下 不 是 正则 的 。 

假设 相反 ， 即 下 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 ， 设 :是 字符 串 0?10?1。 因 为 
s 是 下 的 一 个 成 员 ， 并且 s 的 长 度 大 于 p， 故 泵 引 理 保证 :能够 被 划分 成 3 段 ，;s 二 xyz， 满 
足 引 理 中 的 3 个 条 件 。 目 标 是 证 明 这 个 结果 是 不 可 能 的 。 

条 件 3 再 一 次 是 不 可 缺少 的 。 如 果 没 有 这 一 条 , 令 工 和 z 为 空 串 ， 就 能 够 抽取 s。 当 
满足 条 件 3 时 ， 证 明 如 下 : 因为 y 一 定 仅 由 0 组 成 MryyrE F. 
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选择 ;二 0*10?1， 注 意 到 这 是 一 个 能 显示 下 非 正则 性 “本 质 ” 的 字符 串 。 相 反 地 ， 
例如 字符 串 0802 就 不 能 。 虽 然 080 是 下 的 一 个 成 员 , 但 是 它 能 被 抽取 ， 所 以 不 能 给 出 
FA. w 

TERED 这 里 展示 一 个 非 正则 的 一 元 语言 。 设 D=={1”|n 宇 0}。 即 ，D 包含 所 有 由 
1 组 成 、 长 度 为 完全 平方 的 字符 串 。 用 泵 引 理 证 明 D 不 是 正则 的 。 证 明 采 用 反 证 法 。 

假设 相反 ， 即 D 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 ，s 是 字符 串 1 。 由 于 s 是 D 
的 一 个 成 员 且 长 度 不 小 于 p, RIRE s 能 被 划分 成 3 段 ，*=zyz， 使 得 对 任意 的 这 0， 
字符 串 zyiz 在 D 中 。 和 前 面 的 例子 一 样 ， 要 证 明 这 个 结果 不 可 能 的 。 这 里 需要 考虑 一 下 
完全 平方 数 序列 ， 

O,1,4,9316,25,36,49.°" 

注意 序列 中 相 邻 的 两 个 数 之 间 的 间隔 在 增 大 ， 序 列 中 大 的 数 不 可 能 彼此 靠近 。 

现在 考虑 两 个 字符 串 ryz 和 zyzz。 它 们 之 间 相 差 y 的 一 次 重复 ， 因 而 它们 的 长 度 相 
差 y 的 长 度 。 根 据 泵 引 理 的 条 件 3，|xzxy| 三 p， 从 而 |y| 三 p。 由 于 |xyz|= 二 pp ， 所 以 
[zy z| Sp +p. 但 是 p?+p<p?+2p+1l=(pt 1)’, Woe 2 意味 y KES, AY 
lxy?z|>p?, XIE zy?z 的 长 度 严 格 地 在 p? 和 (p+)? 这 两 个 连续 的 完全 平方 数 之 间 。 
因此 该 长 度 肯 定 不 是 一 个 完全 平方 数 。 从 而 得 出 结论 zyzz& 了 D 并 且 D 不 是 正则 的 。 @ 

GERD 在 运用 泵 引 理 时 ， 有 时 “抽出 ”是 很 有 用 的 。 用 泵 引 理 证明 E= {01 i> 
j 不 是 正则 的 。 采 用 反 证 法 证 明 。 

Bit E EEK. i p 是 泵 引 理 给 出 的 关于 EE 的 泵 长 度 。 令 二 0++11?。 于 是 能够 
被 划分 成 zyz， 且 满足 泵 引 理 的 条 件 。 根 据 条 件 3，y 仅 包含 0。 检 查 字 符 串 zyyz， 看 它 
是 否 在 五 中 。 添 加 一 个 > 使 0 的 数目 增加 。 而 五 包含 0*1* 中 所 有 0 多 于 1 的 字符 串 ， 因 
而 增加 0 的 数目 给 出 的 字符 串 仍 在 正中， 没有 了 矛盾。 因此 需要 试 试 别 的 办 法 。 

泵 引 理 指出 ， 当 ;一 0 时 也 有 zyizE 巨 ， 因 此 考虑 字符 串 zyoz 一 zz。 删 去 串 > 使 0 的 
数目 减少 ,而 s PO 只 比 1 多 一 个 。 因 此 ，xzz 中 的 0 不 可 能 比 1 多， 从 而 它 不 可 能 是 瓦 的 
一 个 成 员 。 于 是 得 到 矛盾 。 a 


练习 
A1.1 下 图 给 出 了 两 台 DFA M AM, 的 状态 图 。 回 答 下 述 关 于 这 两 台 机 器 的 问题 。 





a. 它们 的 起 始 状态 是 什么 ? b 它们 的 接受 状态 集 是 什么 ? 
c 对 输入 aabb， 它 们 经 过 的 状态 序列 是 什么 ? d 它们 接受 字符 串 aabb 吗 ? 
e 它们 接受 字符 串 e 吗 ? 

A1.2 给 出 练习 1.1 中 画 出 的 机 器 Mi 和 Ms 的 形式 化 描述 。 

1.3 DFA M 的 形式 化 描述 为 ({g, ,gg ,q, ,qs},{usd} Org, ,{q,))， 其 中 6 在 下 表 中 给 出 。 试 画 出 这 
台 机 器 的 状态 图 。 


1.9 


1.10 


1.4 


a (w w HEL 34 aMBt 24% db} 


e. (wlw 从 a 开始 并 且 最 多 有 1 个 b)} 
g (w w 的 长 度 为 偶数 并 且 有 奇数 个 a} 
1.5 下 述 每 个 语言 


=] 


言 的 DFA 状态 图 。 在 所 有 问题 中 I= {a,b}. 
^a. (w w 中 不 含 子 串 ab} 


e. (w| w ARE (abt )* 中 的 任意 串 } 
1.6 


g (ww 是 恰好 不 含 2 个 a 的 任意 串 } 


a. (w| w M 1 开始 且 以 0 结束 ) 


下 面 每 个 语言 都 是 两 个 简单 语言 的 交 。 对 每 一 小 题 先 构 造 简单 语 


脚注 所 讨论 的 构造 方法 结合 它们 以 画 出 给 定语 言 的 DFA 状态 图 。 在 所 有 问题 中 B= {a,b} 
c. (w w 含有 偶数 个 a 和 1 个 或 2 个 b} 


都 是 一 个 简单 语言 的 补 。 对 每 一 小 题 先 构造 简单 语言 的 DFA， 然 后 用 其 画 出 给 定语 
c. (w w FERETE ab 也 不 包含 子 串 ba) 


GIF 正则 语言 





ES WY 
= 


A 


的 DFA， 然 后 按照 1.1.5 节 的 
Ab. {w|w 含有 正好 2 个 a 和 至 少 2 个 b} 


Ad. (w w FABAN a 并 且 每 个 a 后 都 跟 有 至 少 一 个 b} 
f. (w w 含有 奇数 个 a 并 且 以 b 结束 ) 


Ab. (wlw PAG Ff baba} 


f. (w w 是 不 在 a* Ub* 中 的 任意 串 ) 


d. (w w 是 不 在 a* b* 中 的 任意 串 ) 
画 出 识别 下 述 语言 的 DFA 状态 图 。 在 所 有 问题 中 字母 表 均 为 {0,1)。 
b. {wlw 含 有 至 少 3 个 1} 


c. {ww ATE 0101( 即 对 某 个 x 和 ,w= 二 x0101y))} 
d. (w w 的 长 度 不 小 于 3, 并 且 第 3 个 符号 为 0) 


f. (wlw RAF E 110} 


e. (wlw 从 0 开始 且 长 度 为 奇数 ,或 者 从 1 开始 且 长 度 为 偶数 ) 
g. {(w|w 的 长 度 不 超过 5} 


h. {wlw 是 除 11 和 111 外 的 任意 串 )} 
i (w| w 的 奇数 位 置 均 为 1) 


j { 也 | 也 含有 至 少 2 个 0, 并 且 至 多 含 1 个 1) 
k. {e5.0} 


L (w w 含有 偶数 个 0 或 恰好 2 个 1} 
m. 4 
Lv 


n. BRS Fb BY A AE R 


e. 18 


Aa 语言 (w| w 以 00 结束 }，3 个 状态 。 
ce 练习 1. 61 中 的 语言 ，6 个 状态 。 


b. 练习 1. 6c 和 1. 6f 中 的 语言 


给 出 误 别 下 述 语 言 的 NFA， 并 且 符 合 规定 的 状态 数 。 在 所 有 问题 中 字母 表 均 为 《0,1) 
= O*1* L 


h. (w| w 是 除 a Al bK) 


b. 练习 1. 6c 中 的 语言 ，5 个 状态 。 
d 语言 人，2 个 状态 ， 
3 个 状态 。 Af. 语言 1* (001+ )* ，3 个 状态 。 
g 语言 te} ，1 个 状态 。 h. 语言 0* ，1 个 状态 。 
1.8 使 用 定理 1. 22 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 并 集 的 NFA 状态 图 。 
a. 练习 1. 6a 和 1.6b 中 的 语言 
使 用 定理 1. 23 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 连接 的 NFA 的 状态 图 。 
a. 练习 1. 6g 和 1. 6i 中 的 语言 。 
a. 练习 1. 6b 中 的 语言 


使 用 定理 1. 24 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 星 号 的 NFA 的 状态 图 
b. 练习 1.6) 中 的 语言 


b. 练习 1. 6b 和 1. 6m 中 的 语言 。 


c. 练习 1. 6m 中 的 语言 
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Z-A 自动 机 与 语言 


证 明 每 一 台 NFA 都 能 够 被 转换 成 只 有 一 个 接受 状态 的 等 价 NFA. 

S D={w Lw 含有 偶数 个 a 和 奇数 个 b 并 且 不 包含 子 串 ab}. MHRA D 的 5- 状 态 的 DFA 图 和 

生成 D 的 正则 表达 式 。( 建 议 尽 量 简单 地 描述 D.) 

令 下 是 {0,1》 上 所 有 串 构 成 的 语言 ， 并 且 下 中 任意 两 个 1 之 间 间 隔 的 符号 数 都 不 是 奇数 。 画 出 

识别 下 的 5- 状态 的 DFA 图 。( 先 找 一 个 4- 状态 的 NFA 作 下 的 补 集 可 能 有 助 于 求解 问题 ,) 

a. 证 明 : £M 是 一 台 识 别 语言 B 的 DFA， 交 换 M 的 接受 状态 与 非 接受 状态 得 到 一 台新 的 DFA, 
则 这 台新 DFA 识别 B 的 补 集 。 因 而 ， 正则 语言 类 在 补 运算 下 封闭 。 

b. 举例 说 明 : 4 M 是 一 台 识 别 语言 C 的 NFA， 交 换 M 的 接受 状态 与 非 接受 状态 ， 得 到 一 台新 
NFA， 这 台新 NFA 不 一 定 识别 C 的 补 集 。NFA 识别 的 语言 类 在 补 运 算 下 封闭 吗 ? 并 解释 
回答 。 

给 出 一 个 反例 ， 说 明 下 述 构造 不 能 证 明定 理 1.24， 即 正则 语言 类 在 星 号 运算 下 封闭 9 。 设 

和 Ni 二 (QQ .25015q,>F1) 识别 Ai。 如 下 构造 N=(Q,.3,0,¢,.F). N WKS Ar . 

a. NN 的 状态 集 是 Ni 的 状态 集 。 

b. N 的 起 始 状态 与 Ni 的 起 始 状态 相同 。 

c. F>={9,}U Fr « 

F 的 接受 状态 是 原来 的 接受 状态 加 上 它 的 起 始 状 态 。 

d. 定义 8 如 下 : 对 每 一 个 9€ Q 和 每 一 个 a€ 5， 

01 (qsa) qF Fi Kafe 

Oi (qsa) U fq} qe Fi Rase 

(建议 : 把 这 个 构造 转换 成 图 ， 如 图 1- 26 所 示 。) 

使 用 定理 1. 19 给 出 的 构造 ， 把 下 图 的 两 台 非 确定 型 有 穷 自 动机 转换 成 等 价 的 确定 型 有 穷 自 动机 。 


soo=| 





a. 给 出 识别 语言 (01U001U010)* 的 NFA, 

b. 将 给 出 的 NFA 转换 成 等 价 的 DFA。 给 出 在 该 DFA 开始 状态 可 达 的 部 分 即 可 。 

给 出 生成 练习 1. 6 中 语言 的 正则 表达 式 。 

使 用 引 理 1. 29 中 描述 的 过 程 ， 把 下 述 正 则 表达 式 转换 成 非 确定 型 有 穷 自 动机 。 

a. (0U1)* 000(0U1)* b. (((00) * (11)) U01)* cg” 

对 于 下 述 每 一 个 语言 ， 给 出 4 个 字符 串 ， 其 中 2 个 是 这 个 语言 的 成 员 ，2 个 不 是 这 个 语言 的 成 
员 。 这 里 假设 字母 表 5= {a,b}。 


a.a* b* b.a (ba)* b 

ea’ Ub* d. (aaa) * 

e. 5° ad* bS* ad" f. aba U bab 

g. (eUa)b h. (aU baU bb) £ * 


使 用 引 理 1. 32 中 描述 的 过 程 ， 把 下 图 的 有 穷 自 动机 转换 成 正则 表达 式 。 


换 名 话说， 必须 给 出 一 台 有 穷 自 动机 Ni ， 关 于 它 构造 出 来 的 自动 机 N 不 识别 Ni 的 语言 的 星 号 。 


1.22 


a4,.23 
1.24 


1. 29 
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在 某 些 程序 设计 语言 中 ， 注 释 出 现在 两 个 分 隔 符 之 间 ， 如 : HAH RCRHAA MERE 
的 语言 。C 中 的 成 员 必 须 以 /# 开 始 、#/ 结 束 ， 并 且 在 开始 和 结束 之 间 没 有 #/。 为 简便 起 见 ， 
假设 CHF HER LS ={a,b,/,#}. 

a. 给 出 识别 C 的 DFA. b. 给 出 生成 C 的 正则 表达 式 。 

设 B 是 字母 表 》 上 的 任 一 语言 。 证 明 B=B+ HA BBCB, 

有 穷 状态 转换 器 (FST) 是 确定 型 有 穷 自 动机 的 一 种 类 型 。 它 的 输出 是 一 个 字符 串 ， 而 不 仅仅 是 
eSB. PAA GARE Ras TI 和 T: 的 状态 图 。 


0/0 1/1 
1/0 2/1 





FST 的 每 一 个 转移 用 两 个 符号 标记 ， 一 个 指明 该 转移 的 输入 符号 ， 另 一 个 指明 输出 符号 。 两 个 
符号 之 间 用 斜 杠 /把 它们 分 开 。 在 五 中 ,从 o 到 g, 的 转移 有 输入 符号 2 和 输出 符号 1。 某 些 转 
移 可 能 有 多 个 输入 -输出 对 ， 例 如 TT PA, 到 它 自身 的 转移 。 当 FST 在 对 输入 串 w 计算 时 ， 从 
起 始 状 态 开 始 ， 一 个 接 一 个 地 取 输 入 符号 wi…w,， 并 且 比 照 输入 标记 和 符号 序列 ww, =w 
进行 转移 。 每 次 沿 一 个 转移 走 一 步 ， 输 出 对 应 的 输出 符号 。 例 如 ， 对 输入 2212011， 机 器 Ti K 
次 进入 状态 qi ,aq ,q, ,qy 990 99, 99, 99, 和 输出 1111000。 对 输入 abbb, T: 输出 1011。 给 出 在 下 述 
每 一 小 题 中 机 器 进入 的 状态 序列 和 产生 的 输出 。 


a. Tı 对 输入 串 011 b. Tı 对 输入 串 211 c. Tı 对 输入 串 121 
d. Tı 对 输入 串 0202 e. T2 对 输入 串 b f. T2 Xt #7 AB bbab 
g. T 对 输入 串 bbbbbb h. T2 对 输入 串 e 


见 练 习 1. 24 中 给 出 的 有 穷 状 态 转换 器 的 非 形 式 化 定义 。 仿 照 定义 1.1 (1.1.1 节 ) 的 模式 ， 给 出 
这 个 模型 的 形式 化 定义 。 假 设 FST 的 输入 字母 表 为 、 输 出 字母 表 为 ,但 没有 接受 状态 集 。 包 
括 FST 的 计算 的 形式 化 定义 在 内 。 (提示 : 一 台 FST 是 一 个 5 元 组 ， 它 的 转移 函数 形 如 6:QX 
SKIT.) 

参见 练习 1. 25 的 解决 方案 ， 给 出 练习 1. 24 中 画 出 的 机 器 TI 和 Ts 的 形式 化 描述 。 

参见 练习 1. 24 中 给 出 的 有 穷 状态 转换 器 的 非 形式 化 定义 。 给 出 一 台 具 有 下 述 行为 的 FST 的 状态 
图 。 它 的 输入 、 输 出 字母 表 都 是 {0，1} 。 它 输出 的 字符 串 与 输入 字符 串 在 偶数 位 相同 、 奇 数位 
相反 。 例 如 ， 对 于 输入 0000111， 它 应 该 输出 1010010, 

使 用 定理 1. 28 给 出 的 过 程 将 下 述 正则 表达 式 转 换 成 NFA。 在 所 有 问题 中 Z= {a,b}. 


a. a(abb) * Ub b. at U Cab) + c. (alU bt J)at bt 
使 用 泵 引 理 证 明 下 述 语言 不 是 正则 的 。 
Ag, A = {0"1"2" |72 之 0) b. A2 ={ww w|wE {a,b}* } 


Ac. As 一 {a |n 宇 0}( 这 里 az 表示 2" 个 a 构成 的 串 ) 
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1. 30 


问题 
1.31 


1. 32 


1.33 


A1.34 


*1. 35 


1. 36 


1.37 


1. 38 


F-BED 自动 机 与 语言 


指出 下 述 关 于 0* 1* 不 是 正则 语言 的 “证 明 ” 的 错误 (由 于 0* 1* 是 正则 语言 ， 所 以 “证 明 ” 存 
在 错误 ): 用 反 证 法 证 明 。 假 设 0* 1* 是 正则 的 。 设 p 是 泵 引 理 给 出 的 关于 0* 1* 的 泵 长 度 。 选 
FE s 为 串 0?1?。 已 知 s 是 0*1* 的 一 个 成 员 ,， (AB) 1. 38 表明 s 不 能 被 抽取 。 这 样 得 到 矛盾 。 因 此 
0* 1* 不 是 正则 的 。 


对 语言 A 和 语言 B, AMB 的 完全 间隔 交叉 (perfect shuffle) A: 

{wlw=alb01… abe, KF aie ar ECA #HE b bi EB, 任 一 aibi ES} 
证 明 : 正则 语言 类 在 完全 间隔 交叉 下 封闭 。 
对 语言 A 和 语言 B, 设 A 和 8B 的 间隔 交叉 (shuffle) A: 

{w|w=a1bi"** abe, KP ayes ar EA 并 且 b1… bEB, 任 一 ai,b: E35") 
证 明 : 正则 语言 类 在 间隔 交叉 下 封闭 。 
设 A 为 任意 语言 。 定 义 DROP-OUT(A) 得 到 的 语言 包含 的 串 都 是 A 中 的 串 移 除 一 个 符号 后 得 
AH. XE, DROP-OUT(A)=({2z|zyzE A, 其 中 x,zE3* ,y€E53}。 证明: 正则 语言 类 在 运算 
DROP-OUT 下 封闭 。 像 定理 1. 23 一 样 ， 用 图 给 出 一 个 证 明 ， 再 通过 构造 给 出 一 个 更 形式 化 的 
证 明 。 
设 B 和 C 是 3= (0, 1} 上 的 语言 。 定 义 


B<-C=(wEB|HFTHA yEC E why 含有 同样 个 数 的 1) 


证 明正 则 语言 类 在 运算 < 下 封闭 。 

i A/B={w| 对 于 某 zxE€EB,wzxE€A}。 证 明 如 果 A 是 正则 的 ，B 是 任意 语言 那么 A/B HIE 
则 的 。 

对 于 任意 的 字符 串 w= w w w, wh RHEE YI ES w 得 到 的 字符 串 ， 记 作 wR， 
即 wR =w wz wl 。 对 于 任意 语言 A， 设 AR 一 (wwwEA)。 

证 明 : 如 果 A 是 正则 的 ， 则 A& 也 是 正则 的 。 


设 
0 1 
eee Eh 
0 1 0 l 
3 包含 所 有 高 度 为 3 的 0 和 1 的 列 。53 上 的 字符 串 给 出 三 行 0 和 1。 把 每 一 行 看 作 一 个 二 进 制 


数 ， 令 


例如 ， 


B={wE 3" |w 最 下 面 的 一 行 等 于 上 面 两 行 的 和 ) 
1 
0 


由 


证 明 如是 正则 的 〈 提 示 : 证 明 BY 是 正则 的 会 容易 一 些 。 假 设 已 知 问题 1. 36 PHAR). 


设 

= {(o) LG} LI G] 
XH, > 包括 所 有 高 度 为 2 的 0 和 1 的 列 。5。 上 的 字符 串 给 出 两 行 0 和 1。 把 每 一 行 看 作 一 个 
二 进 制 数 ， 令 


¢ B 








C= {wE} | ww 下面 一 行 是 上 面 一 行 的 3 倍 )， 
例如 ， 


ined 


. 41 
- 42 
. 43 


jms j 


1.46 


A* 1.48 


1. 49 


1. 50 
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While 人 Dose 


证 明 C 是 正则 的 。( 可 以 假设 已 知 问题 1. 36 中 的 结果 。) 
ZS. 与 问题 1. 38 中 的 相同 。 把 每 一 行 看 作 是 一 个 二 进 制 数 ， 并 且 设 
D={wE z * |w 上 一 行 表 示 的 数 大 于 下 一 行 表示 的 数 } 


| alela lalen s= alle 


设 5 与 问题 1. 38 中 的 相同 。 把 上 、 下 行 都 看 作 是 0 和 1 的 字符 串 ， 并 且 设 
E={wE z: * |w 的 下 一 行 是 上 一 行 的 反 转 } 


例如 ， 


证 明 E REEK. 
设 B,={a' |k fin 的 整数 倍 }。 证 明 : 对 每 一 个 n 宇 1， 语言 B, 是 正则 的 。 
设 C, 二 {xlz 是 一 个 二 进 制 数 , 且 是 的 整数 倍 }。 证 明 : 对 每 一 个 nS], BAC, 是 正则 的 。 
一 台 全 路 径 NFA (all-NFA) M 是 一 个 5 元 组 (Q,3,6,g,,F)。 如 果 M rE" 的 每 一 个 可 能 
的 计算 都 结束 在 下 中 的 状态 ， 则 M 接受 z+。 注意 ， 相 反 地 ， 普 通 NFA 只 需 有 一 个 计算 结束 在 接 
受 状态 ， 就 接受 这 个 字符 串 。 证 明 : 全 路 径 NFA 识别 正则 语言 类 。 
定理 1. 28 中 的 构造 表明 ， 每 一 个 GNFA 都 等 价 于 一 个 只 含 两 个 状态 的 GNFA。 对 DFA， 有 相 
RAMA. WAR: 对 每 一 个 & 之 1， 都 有 语言 A: 夺 {10,1}* 能 被 一 个 个 状态 的 DFA 识别 ， 但 不 
能 被 只 有 & 一 1 个 状态 的 DFA 识别 。 
如 果 存 在 字符 串 = 使 得 zz 一 >， 则 称 字符 串 zx 是 字符 串 y HAS (prefix), WR r Æ y WAHE 
zsAy, WH xy HAA (proper prefix) 。 下 面 每 小 题 定 义 一 个 语言 A 上 的 运算 。 证 明 : E 
则 语言 类 在 每 个 运算 下 封闭 。 
Aa. NOPREFIX(A)= (wE Alw 任 一 真 前 级 都 不 是 A HICK} 

b. NOEXTEND(A)=(w€ Alw 不 是 A PEM SH BH Hate) 
参见 练习 1. 24 中 给 出 的 有 穷 状态 转换 器 的 非 形 式 化 定义 。 证 明 不 存在 对 每 一 个 输入 w 都 能 输出 
wR 的 FST， 其 中 输入 和 输出 字母 表 为 {0,1}. 
Hr My RAS SHR, 是 一 个 语言 。 如 果 存 在 字符 串 z， 使 得 zz 和 yz 中 恰好 有 一 个 是 工 的 
成 员 ， 则 称 x 和 yy 是 用 上 可 区 分 的 ; 和 否则， 对 每 一 个 字符 串 zx，zz 和 yz 要 么 都 是 、 要 么 都 不 是 
L 的 成 员 ， 则 称 xz 和 yy 是 用 L 不 可 区 分 的 。 如 果 工 和 y 是 用 世 不 可 区 分 的 ， 记 作 z=zy。 证 明 
= 是 一 个 等 价 关 系 。 
Myhill-Nerode 定理 。 参 见 问 题 1. 47, 设 工 是 一 个 语言 ，X 是 一 个 字符 串 集合 。 如 果 X 中 的 任意 
两 个 不 同 的 字符 串 都 是 用 工 可 区 分 的 ， 则 称 X 是 用 工 两 两 可 区 分 的 。 定 义工 的 指数 为 用 工 两 两 
可 区 分 的 集合 中 的 元 素 个 数 的 最 大 值 。 工 的 指数 可 能 是 有 穷 的 或 无 穷 的 。 
a. 证 明 : 如 果 工 被 一 台 有 个 状态 的 DFA 识别 ， 则 工 的 指数 不 超过 上 。 
b. 证 明 : 如 果 工 的 指数 是 一 个 有 穷 数 k， 则 它 被 一 台 有 上 个 状态 的 DFA 识别 。 
c 由 此 得 到 : L 是 正则 的 当 且 仅 当 它 有 有 穷 的 指数 。 而 且 ， 它 的 指数 是 识别 它 的 最 小 DFA 的 

K". 

考察 语言 FF 二 {aibict 1i,j,k 之 0, 并 且 阁 i 二 1, 则 j=}. 
a. 证 明 下 不 是 正则 的 。 
b. 用 泵 引 理 说 明 下 是 一 个 正则 语言 。 即 对 于 一 个 给 定 的 泵 长 度 p,， 下 满足 泵 引 理 的 三 个 条 件 。 
c. 解释 为 什么 (Ca) Al b 与 泵 引 理 不 矛盾 。 
泵 引 理 指出 ， 对 每 一 个 正则 语言 都 有 一 个 泵 长 度 p， 使 得 对 于 该 语言 中 每 一 个 字符 串 ， 如 果 它 的 
长 度 等 于 或 大 于 p 就 能 够 被 抽取 。 如 果 p 是 语言 A 的 泵 长 度 ， 则 任意 的 p 宇 p 也 是 A 的 泵 长 
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1. 52 


1.53 


1.54 


1.55 
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度 。A 的 最 小 泵 长 度 是 A 的 泵 长 度 的 最 小 值 。 例 如 ， 如 果 A 二 01* ， 则 最 小 泵 长 度 等 于 2。 理 由 
wF: A 中 长 度 为 1 的 字符 串 s=0 不 能 被 抽取 ， 而 A 中 任何 长 度 大 于 等 于 2 的 字符 串 都 含有 1， 
把 它 划分 成 z= 二 0，y 二 1，z 为 其 余部 分 ， 从 而 能 够 被 抽取 。 对 于 下 述 语言 ， 给 出 最 小 有 泵 长 度 ， 
并 加 以 证 明 。 


Aa. 0001 * ah 0* 1* agoro L* 
sa gI ir 1* lites i e. (01) * fic 
‘1° 01" 0)" H TOLLIT ZO i 1011 
ke 
证 明 下 述 语言 不 是 正则 的 。 证 明 可 以 使 用 泵 引 理 和 正则 语言 类 在 并 、 交 、 补 运算 下 封闭 的 性 质 。 
a. {071"0" | m,n>0} Ap. {07 1" | mn) 
c. {w| we {0,1}* 不 是 一 个 回 文 }9 *d. {wtw|w,tE {0,1} +} 


设 S={1,4} 以 及 
Y={w| xt k20,2;€1* H ifxy H r: Arj w= zr # r: # > Harr? 
证 明 : Y 不 是 正则 的 。 
设 s={0,1} 以 及 
D={wlw 中 子囊 01 和 子 串 10 的 出 现 次 数 相等 ) 
由 于 101 含有 一 个 01 和 一 个 10， 因 此 101€ D。 而 1010 含有 两 个 10 和 一 个 01， 所 以 1010ED, 
证 明 : DD 是 正则 语言 。 
设 5={a,b}。 对 每 一 个 k 宇 1, RG 是 由 所 有 从 右 端 起 第 & 个 位 置 是 a 的 串 组 成 的 语言 。 这 样 
Ci 二 3* a3, 分 别 用 状态 图 和 形式 化 描述 的 方法 描述 识别 Cs 的 有 十 1 个 状态 的 NFA., 
考虑 问题 1. 54 中 定义 的 语言 C:。 证 明 对 每 一 个 k， 没 有 状态 数 小 于 2* 的 DFA BIC. 
设 5={a,b)。 对 每 一 个 k 宇 1, HD, 是 由 所 有 最 后 个 符号 中 至 少 含 一 个 a 的 串 组 成 的 语言 。 这 样 
Di 二 3* aSU). 分 别 用 状态 图 和 形式 化 描述 的 方法 描述 识别 D 且 最 多 有 十 1 个 状态 的 DFA, 
a 设 A 是 无 穷 正 则 语言 。 证 明 : A 能 够 被 拆 分 成 两 个 不 相交 的 无 穷 的 正则 子 集 。 
b. 设 B 和 DD 是 两 个 语言 。 如 果 BCD 并且 DD 无 穷 地 包含 所 有 不 在 B 中 的 串 ， 则 记 作 Be D。 证 
明 : WE B 和 DD 是 两 个 正则 语言 且 BE D， 那 么 可 以 找到 一 个 正则 语言 C, HH BECED. 
wN 是 识别 某 语言 A 的 一 台 含 & 个 状态 的 NFA. 
a. 证 明 : 如 果 A 非 空 ， 则 A 含有 的 串 的 长 度 最 大 为 。 
b 通过 举例 说 明 : 如 果 将 (a) 中 的 两 处 A 替换 为 A， 则 (a) 不 一 定 为 真 。 
c. TEM: 如 果 去 非 空 ， 则 去 含有 的 串 的 长 度 最 大 为 24。 
d. 证 明 (c) 中 给 出 的 边界 是 相当 紧密 的 。 即 对 每 一 个 k， 证明 NFA 识别 语言 At ， 其 中 A 是 非 
空 的 并 且 A 中 最 短 的 成 员 捉 的 长 度 是 k 的 指数 。 与 (c) 中 的 边界 非常 接近 。 
iE: 对 每 一 个 n>0, AB, 都 存在 ， 其 中 
a. B, 被 含有 7 个 状态 的 NFA 识别 。 
b. 对 正则 语言 A, WR B, =A U…UAk ， 那 么 至 少 有 一 个 Ai 需要 含有 指数 级 个 数 状态 的 DFA, 
EA (homomorphism) 是 从 一 个 字符 集 经 过 另 一 个 字符 集 到 字符 串 的 图 数 f:S-r*. EM 
fw) = flw) fw.) flan) 将 f 扩展 为 在 字符 串 上 的 操作 ， 其 中 w==wiw2…w, 并 上 且 w; E53。 
进一步 ， 对 任意 语言 A， 定义 f(A)=={f(w)|wE A) 将 f 扩 展 为 对 语言 的 操作 。 
a 通过 形式 构造 证 明 : 正则 语言 类 在 同 态 下 封闭 。 换 言 之 ， 给 定 一 个 识别 BM DFA M 和 同 态 
f， 构 造 一 个 识别 (CB) 的 有 穷 自 动机 M 。 考 虑 你 构造 的 机 器 M ， 是 否 在 所 有 情况 下 它 都 是 
一 个 DFA? 


回 文 (palindrome) 是 顺 着 读 和 倒 着 读 都 一 样 的 字符 串 。 
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b. 通过 一 个 例子 证 明 : 非 正 则 语言 类 在 同 态 下 不 封闭 ，。 
设 语言 A 的 旋转 闭 包 (rotational closure)  RC(A)={yzr|zyE€A}. 
a. WEAR: 对 任何 语言 A，RC(A) 王 RCCRC(CA) ) 。 
b. 证 明 : 正则 语言 类 在 旋转 闭 包 下 封 财 。 
设 S={0,1,+,=} UR 
ADD={x=yt2z|z,y,.2 EZER, FHA ecey 与 zx 的 和 )} 
证 明 ADD 不 是 正则 的 。 
若 A 是 一 个 自然 数 的 集合 , & 是 大 于 1 的 自然 数 ， 令 
B(A Siw wA 中 某 个 数 以 k 为 底 的 表示 ) 

这 里 不 允许 数 的 表示 以 0 开头 。 例 如 ，B2({3,5}) 二 {11,101},B3({3,5)) 二 {10,12}。 给 出 一 个 
EAA, Œ B(A) 是 正则 的 ， 而 B3(A) 不 是 正则 的 ， 并 加 以 证 明 。 
车 A 是 任 一 语言 ， 令 A1 是 A 中 字符 串 的 前 半 段 组 成 的 集合 ， 即 

Al —{z| NTR” plam] B cye A} 
证 明 : 如 果 A 是 正则 的 ， AA AL 也 是 正则 的 。 
车 A 是 任 一 语言 ， GAL12A 中 所 有 字符 串 删 去 中 间 的 三 分 之 一 后 得 到 的 字符 串 组 成 的 集 
合 ， 即 

Ai. =(ezl ATEA yy，| 工 | 一 |y| 王 |z| 且 ryzEA} 
证 明 : 如 果 A 是 正则 的 ， 那 么 A#-+ 不 一 定 是 正则 的 。 
设 M=(Q,5,6,g,,F) 是 一 个 DFA 并 且 M 的 状态 h RAER “R”. MAh 的 同步 序列 〈syn- 
chronizing sequence) 为 串 s，sEY* ， 其 中 对 每 一 个 9g€ Q,6(g,s) 二 hh。( 这 里 已 经 把 6 扩展 成 串 ， 
因此 6(g,s) 等 于 当 M 从 状态 g 开始 ， 读 入 输入 ;的 结束 状态 。) 如 果 对 某 个 状态 h，M 有 一 个 同 
步 序 列 ， 那 么 称 M 是 可 同步 的 (synchronizable)。 证 明 : 如 果 M 是 一 台 有 -状态 的 可 同步 的 
DFA ， 那 么 它 有 一 个 长 度 最 大 为 kP 的 同步 序列 。 试 试 增 大 这 个 边界 。 
对 语言 A 和 语言 B， 定 义 avoids 运算 如 下 : 
A avoids B={w| | wEA 并且 B 中 的 任何 字符 串 都 不 是 A HTB} 

证 明 : 正则 语言 类 在 avoids 运算 下 封闭 。 
设 5={0,1)， 
a. 若 A={0'u0* |k 之 1 并 且 ue d*}. WEA: A 是 正则 的 。 
b. 若 B={0'1lu0*|kA>1 并 且 w€3* }。 证 明 : B 不 是 正则 的 。 
设 M, 和 M: 是 分 别 包 含 kl 和 kz 个 状态 的 两 个 DFA, 设 U=L(Mi)UL(M;)。， 
a. WEH: 如 果 U 隆 名， 那么 U 包含 长 度 小 于 maxth, k) 的 字符 串 。 
b. WEH: 如 果 U 关 3* ， 那 么 U 不 包含 长 度 小 于 k1k 的 字符 串 。 
i 3={0,1, #},C={r# #r|xzE {0,1)*}. 证明: C 是 上 下 文 无 关 语 言 (CFL). 
a. 设 B={1ty| yE {0,1})*, FAMAS1, 含有 至 少 & 个 1)}。 证 明 : B 是 正则 语言 。 
b. 设 C={1*y|yE10,1}* ， 并且 对 k 宇 1，y 含有 至 多 k 个 1}。 证明: C 不 是 正则 语言 。 
传统 切 牌 方法 将 一 副 纸牌 随意 分 成 两 部 分 ， 交 换 后 再 重新 组 合成 一 副 牌 。 更 复杂 点 的 方法 被 称 为 
Scarne 切 牌 ， 首先 将 一 副 牌 分 成 3 部 分 ， 重 新 组 合 时 将 中 间 那 部 分 放 在 最 上 面 。 受 Scarne 切 牌 
启发 ， 定 义 一 种 对 语言 的 操作 。 对 语言 A， 设 CUTA) = {yrz|ryzEA}. 
a 给 出 一 个 语言 BME CUT(B)ÆCUT(CUT(B)). 
b. 证 明正 则 语言 类 在 CUT 操作 下 封闭 。 
设 3={0,1}，WWi 二 {ww|wE€E3" #H w 的 长 度 为 &}。 
a. 证 明 无 论 & 取 何 值 ， 所 有 状态 数 少 于 2* 的 DFA 都 不 能 识别 WW... 
b. 描述 一 个 状态 更 少 的 能 识别 WWi (WW, 的 补 集 ) 的 NFA. 
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习题 选 解 
1.1 X Mi: aq; b {q}; caqly qq qily qi; d 不 接受 ; e 不 接受 。 
对 Mz: a.q; b. (aiyqi} C qiqa g d 接受 ; e 接受 。 
1.2 Mi=({g ,gq;»q43},{a,b},61,g],{g,}) 
M2 = (iq, +92 +93 294} » {asb} ,02 9g) ,(q1 ,44}) 
转移 函数 分 别 为 : 





1.4 b. 语言 {w | 包含 有 正好 2 个 a} 和 语言 (人 也 | 了 已 含 有 至 少 2 个 b) 的 DFA 如 下 所 示 : 


i b b a, b a a a, b 
LA hni ie, 全 Ea M 
© en, Os © a ) ++ 


使 用 自动 机 的 交 运 算 构 造 出 如 下 DFA: 





d. 语言 (wlw 含有 偶数 个 a} 和 语言 (wlw 中 每 个 a 后 都 跟 有 至 少 一 个 b} 的 DFA 如 下 所 示 : 


“ee a 
a b 


使 用 自动 机 的 交 运 算 构造 出 如 下 DFA: 





虽然 问题 并 没有 要 求 简化 DEFA， 但 可 以 合并 某 


些 





b. 如 下 DFA 识别 {w| 多 含有 子 串 baba}. 


a 


b b 


a,b 
A ee 
© name S ee ® =. 
a 
如 下 DFA 识别 (w| w RBA TĦ baba}. 


A 


1.7 


a 
A 
o 
0, 1 
1 


f. 
ay 
> | 


om o> 
设 N=(Q,3,6,q,,F) 为 任 一 NFA。 构 造 一 个 只 有 一 个 接受 状态 的 NFA N ， 它 与 NN 接受 同样 的 
每 一 个 qe Qsla€s., 


(q.a) 
0 (q,a) za 
并 且 对 每 一 个 <cE 互 ,9 q 


6(q,a)U tq 
accep 


na =g 


语言 。 非 形式 地 讲 ，N 与 N 很 相近 ,但 是 N 从 相对 于 N 是 接受 状态 的 状态 到 新 的 接受 状态 accept 
证 明 “ 当 且 仅 当 ” 的 两 个 方向 : 


有 FEB RAS ws 上 没有 新 的 转移 。 形 式 地 讲 ，N' 一 (QU {goo ) ,3,8 +d + (accep ))， 其 中 对 


w Rafe KRQEF 
WE 
(一 > ) 假设 B=BT 9 证 明 BBE- B, 


wR a=eRKQqeF 


由 于 对 所 有 语言 BBS B+ 成 立 ， 因 此 如 果 B=Bt, IA BBCB, 
(一 ) 假设 BBCB, 证 明 B=B*, 


由 于 对 所 有 语言 有 BCB* ， 所 以 只 需要 证 明 BtB, WR wE B+ ,那么 w 二 zx1x2… xz， 其 中 每 
5 BCs. 


一 个 r EB 并 且 上 有 宇 1。 因 为 x1，zxz EB 并 且 BBCB， 因 而 有 2122€B. KWH, AF zir: Æ B 
假设 BBCB, 


中 并 且 zs 也 在 B 中 ， 因 而 有 tir: x3EB。 以 此 类 推 re r CB. AW wEB, FETIH 
后 半 部 分 的 论证 可 以 用 如 下 的 归纳 证 明 形 式 化 地 描述 ， 
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1. 29 


1. 34 


1. 45 


1. 46 


1. 48 
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Ma: HE—T kzl WR tis “a wEB, 那么 ar 4 EB. 
归纳 基础 : 当 &A=1 时 ， 陈 述 显 然 成 立 。 
AAR: 对 每 一 个 有 宇 1， 假设 断言 在 & 时 成 立 。 证 明 上 十 1 时 也 成 立 。 
如 果 tis ts Tee te+1 EB, 那么 根据 归纳 假设 xa zs EB， 有 xe rexe+1€ BB, 但 BBCB, 
因此 aie zi+1EB。 这 样 就 证 明了 归纳 步骤 和 汤 言 。 该 断言 指出 ， 如 果 BBCB， 那 么 B CB, 
a. 假设 Ay ={0"1"2"|n>0} 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 。 选 择 s 为 串 012, HF s 
EA 的 一 个 成 员 并 且 s 比 p BK, 5 BRE s 可 以 被 划分 成 3 片 ，s 二 zyz， 其 中 对 任意 i> 
0， 串 xyz 在 Al 中。 考虑 下 面 两 种 可 能 性 : 
1. 串 y 仅 由 0 组 成 ， 仅 由 1 组 成 ， 或 者 仅 由 2 组 成 。 在 这 些 情 况 下 ， 串 zyyz 将 不 会 有 等 数量 
的 0，1 和 2。 因 此 zyyz 不 是 Ai 的 成 员 ， 了 矛盾 。 
2. Fy 由 不 止 一 种 符号 组 成 。 在 这 种 情况 下 ， 串 zyyz 将 含有 次 序 不 定 的 0，1 或 2。 因 此 zyyz 
不 是 Al KBER, FE. 
两 种 可 能 性 得 到 的 都 是 矛盾 。 因 此 ，Ai 不 是 正则 的 。 


c 假设 A= {a |n>0) 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 。 选 择 * Apa., hF s EA 

的 一 个 成 员 并 且 skk p 更 长 ， 泵 引 理 保证 s 可 以 被 划分 成 3 片 ，*=zyz， 满 足 泵 引 理 的 三 个 
条 件 。 
第 三 个 条 件 说 明 | zy | <p. Wb p<2?, 可见 | y| 过 22 。 因 此 |zxyyz| 二 |zyz| 十 |y| 达 2# 十 
22 一 2 入。 第 二 个 条 件 要 求 |y| 六 0， 于 是 22<|zyyz|< 到 2i+1。 这 样 zyyz 的 长 度 不 可 能 是 2 的 
某 次 方 。 因 此 zyyz 不 是 As WRR, FA. AM, A 不 是 正则 的 。 

设 DFA Mg=(Qg>2.08>¢3:FB) M DFA Mc 二 (Qc ,5,6c ,gc，;Fc) 分 别 识别 B 和 C。 按 如 下 方式 


构造 识别 B-C 的 NFA M 王 (Q,3,6,go ;F)。 为 了 确定 其 输入 w 是 否 在 B<C 中 ,机 器 M 要 检查 
wEB， 并 且 并 行 、 非 确定 地 猜测 和 w 含 有 同样 个 数 1 的 串 y 并 且 检 查 yEC。 

1. Q=QB XQc. 

2 对 (ane QHMacs, EM 


{ (dp (q,0) 1) } 如 果 a=0 
6( (gsr) ,a) =< 1(6p(gs1),6c(r,1)))} ”如果 a 二 1 
{(q,dc(r,0))} 如 果 a=e 


3: ga = (Us 

4. F=Fp X Fe. 

a. Ww M 二 (Q,3,6,qo ,FF) 是 识别 A 的 一 台 DFA， 其 中 A 是 某 正则 语言 。 按 如 下 方式 构造 识别 
NOPREFIX(A) 的 M=(Q ,5,6 9 F): 
1.Q°=Q. 

/ po {6(r,a)} WẸ réF 

2. 对 rEQ 和 aE€E3 定义 8 (rsa) = 5 AREF 
3. do =o © 
4 F =F, 

假设 相反 : 存在 某 个 FST TERA w 时 输出 wR, BRA 00 和 01。 对 于 输入 O00, T HER 

出 00， 对 于 输入 01， 工 必定 输出 10。 在 这 两 种 情况 下 ， 输 入 的 第 一 位 都 是 0， 但 输出 的 第 一 位 却 

不 一 样 。 对 于 FST 来 说 是 不 可 能 这 样 操作 的 ， 因 为 FST 在 读 入 第 二 位 输入 之 前 就 要 产生 第 一 位 输 

出 。 因 此 不 存在 这 样 的 FST. 

a. 用 反 证 法 证 明 该 断言 。 令 M 为 一 识别 工 WRIA DFA, (RHR: 工 的 指数 大 于 &。 这 就 意味 
着 某 个 元 素 个 数 大 于 & 的 集合 X 能 够 被 工 两 两 区 分 。 由 于 M 有 上 个 状态 ,根据 钮 集 原 理 ，X 
含有 两 个 不 同 的 串 z 和 y， 其 中 6(g, ,Zz) 二 6(go,y)。 这 里 6(gqo ,zx) 是 M 从 起 始 状态 gu 出 发 在 


1. 50 
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读 人 输入 串 x 后 所 在 的 状态 。 那 么 ， 对 任意 串 EI", Mg, ,zz) 一 8(dq ,yz)。 因 而 rz Ml yz 要 
么 都 在 L 中 ， 要 么 都 不 在 工 中 。 但 这 样 x Aly 不 再 被 L 区分， 与 假设 的 X 被 世 两 两 区 分 矛盾 。 


. 设 X=(s ,被 了 两 两 区 分 。 构 造 识 别 工 的 有 & 个 状态 的 DFA M=(Q,2,6,q,.F). & 


Q= {q ，… ,qi} FF AEM lq a) Kao KP sE sa (关系 三 L 的 定义 见 问题 1. 47)。 注 意 对 
于 s; EX,sj 三 L sia; 否则 ，XU sia 可 能 含有 A 十 1 个 元 素 并 且 被 L 两 两 区 分 ， 这 会 与 假设 L 的 
指数 为 k 相 矛 盾 。 设 下 = 二 {q,| EL), ERAS Gq X qo XIE s; 寺 Le 。 构 造 M 使 得 对 任 一 状 
Ma {s|6(g0 55) 二 q,}) 二 {sls 二 i si}。 因 此 MRI L., 


. 假设 工 是 正则 的 ， 并 且 令 & 是 识别 工 的 DFA 的 状态 数 。 那 么 根据 (a) 可知 工 的 指数 的 最 大 值 为 


ko HR. Æ LEBER k, BARE b) 可 知 它 被 有 个 状态 的 DFA 识别 ， 因 而 是 正则 的 。 为 
了 证 明 工 的 指数 是 接受 它 的 最 小 DFA 的 大 小 ， 假 设 工 的 指数 恰好 是 &。 那 么 ， 根 据 〈b)， 存 在 一 
个 接受 工 的 人 状态 DFA。 这 是 最 小 的 DFA， 因 为 如 果 还 有 更 小 的 ， 就 可 以 根据 Ca) 证明 工 的 
指数 小 于 A。 


. 最 小 的 到 长 度 为 4。 串 000 在 语言 中 但 不 能 被 抽取 ， 因 而 这 个 语言 的 稍 长 度 不 是 3。 如 果 s 的 长 


度 为 4 或 更 长 ， 则 它 包 含 1 在 其 中 。 通 过 将 划分 为 xyz， 其 中 开 是 000，y 是 第 一 个 1，z 是 其 
后 的 所 有 符号 ， 可 以 满足 泵 引 理 的 三 个 条 件 。 


. 最 小 的 泵 长 度 为 1。 由 于 串 在 语言 中 并 且 不 能 被 抽取 ， 因 而 泵 长 度 不 可 能 是 0。 语 言 中 的 每 一 


个 非 空 串 都 能 被 划分 为 zyz， 其 中 ae, 是 第 一 个 字符 ，z 是 剩 下 的 部 分 。 该 划分 满足 有 泵 引 
理 的 三 个 条 件 。 
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中 长 度 至 少 为 3 的 串 。 如 果 s 由 0*1+0+1* 生成, 并且 s 以 0 或 11 开始 ， 写 作 ;二 xyz， 其 中 
=e, 是 第 一 个 符号 ，z 是 ;的 余下 部 分 。 如 果 s 由 0*1+0t1* R, 并且;s 以 10 开始， 写 
YE s=zyz, P x 二 10，y 是 下 一 个 符号 ，z Es 的 余下 部 分 。 按 这 种 方式 划分 s 可 以 证 明 它 能 
够 被 抽取 。 如 果 s 由 10* 1 生成 ， 可 以 将 其 写成 zyz， 其 中 zx 二 1，y 二 0, ces 的 余下 部 分 。 这 
种 划分 给 出 了 抽取 s 的 一 个 途径 。 


. 设 B 二 {0"1"|m 关 n}。 可 以 观察 到 BN 站 0* 1* 二 {0*1* 1k 宇 0}。 若 B 是 正则 的 ,那么 B 和 B 站 0* 


1* 也 是 正则 的 。 但 是 已 知 {0*1*1k 宇 0} 不 是 正则 的 ， 因 而 B 不 是 正则 的 。 

男 一 种 选择 ， 直 接 用 泵 引 理 证 明 B 是 非 正 则 的 , 但 这 样 做 需要 一 定 的 技巧 。 假 设 B={0"1"| 
mn) 是 正则 的 。 令 p 为 泵 引 理 给 出 的 泵 长 度 。 可 以 观察 到 p! 不 出 现在 从 1 到 p 的 所 有 整数 
中 ， 其 中 p! = 二 p(p 一 1)(p 一 2)…1。 串 s 二 0*1z?T?! CB, 并且 |s| 宇 p。 这 样 泵 引 理 指出 s 可 以 
被 划分 为 zyz， 这 里 z= 二 0<，y 二 0 和 ,z= 二 0:1t+t! ,其 中 5 宇 1 并 且 atbt+c=p. Ks HB 
ry'itlz, 其 中 j= 出 /b, BA yi=0F!, Mitt yitl =oetel, 并 是 s =0+6+ctp! ]ptp! | 这 就 给 出 
s =OPte! 12+?! €B, HIS. 


$ 
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上 下 文 无 关 文 法 





上 一 章 介 绍 了 有 穷 自动 机 和 正则 表达 式 这 两 种 不 同 但 等 价 的 描述 语言 方法 。 虽 然 它 们 
能 描述 许多 语言 ， 但 还 有 一 些 简单 的 语言 不 能 用 它们 描述 ， 如 (071"|n>0}. 

本 章 介 绍 一 种 能 力 更 强 的 描述 语言 数学 模型 ， 上 下 文 无 关 文 法 (context-free grammar), 
它 能 够 描述 某 些 应 用 广泛 的 具有 递归 结构 特征 的 语言 。 

在 研究 目 然 语 言 时 ， 人 们 引入 了 上 下 文 无 关 文法 。 例 如 ， 名 词 短语 可 以 出 现在 动词 短 
语 中 ， 反 之 ， 动 词 短语 也 可 以 出 现在 名 词 短 语 中 ， 因 此 在 名 词 、 动 词 、 介 词 以 及 它们 的 短 
语 之 间 的 关系 中 存在 着 自然 的 递归 ， 上 下 文 无 关 文 法 有 助 于 整理 并 理解 这 些 关系 。 

上 下 文 无 关 文 法 在 程序 设计 语言 的 规范 化 及 编译 中 有 重要 应 用 。 程 序 设 计 语 言 的 文法 
犹如 外 语 语法 参考 书 ， 设 计 人 员 在 编写 程序 设计 语言 的 编译 器 和 解释 器 时 ， 常 需 先 获取 该 
语言 的 文法 。 大 多 数 编译 器 和 解释 器 都 包含 一 个 语法 分 析 器 (parser)， 它 在 生成 编译 代码 
或 解释 程序 执行 前 ， 提 取出 程序 的 语义 。 上 下 文 无 关 文 法 使 得 构造 语法 分 析 器 的 工作 变 得 
容易 ， 某 些 工 具 甚 至 能 根据 文法 自动 地 生成 语法 分 析 器 。 

与 上 下 文 无 关 文法 相关 的 语言 集合 称 为 上 下 文 无 关 语 言 (context-free language), € 
包括 所 有 的 正则 语言 以 及 许多 其 他 语言 类 。 本 章 将 给 出 上 下 文 无 关 文 法 的 形式 化 定义 ， 并 
研究 上 下 文 无 关 语言 的 性 质 。 此 外 ， 还 将 介绍 识别 上 下 文 无 关 语 言 的 机 器 下 推 自动 机 
(pushdown automata) ， 它 使 我 们 能 够 进一步 地 了 解 上 下 文 无 关 文法 的 能 力 。 


2. 1 上 下 文 无 关 文 法 概述 


下 面 给 出 一 个 上 下 文 无 关 文 法 的 示例 ， 称 其 为 Gi: 
A>0A1 
A—>B 
B> # 

一 个 文法 由 一 组 替换 规则 (substitution rule) 组 成 ， 替 换 规 则 又 称 为 产生 式 (pro- 
duction) 。 每 条 规则 占 一 行 ， 由 一 个 符号 和 一 个 字符 串 构成 ， 符 号 和 字符 串 之 间 用 箭头 隔 
开 。 符 号 称 为 变 元 〈variable) ， 字 符 串 由 变 元 和 另 一 种 称 为 终结 待 (terminal) 的 符号 组 
成 。 变 元 常用 大 写字 母 表 示 ， 终结 符 类 似 于 输入 字符 ， 常 用 小 写字 母 、 数 字 或 特殊 符号 表 
示 。 一 个 变 元 被 指定 为 起 始 变 元 (start variable) ， 通 常 它 出 现在 第 一 条 规则 的 左边 。 在 上 
ANA, SHG 有 3 AMM, AMBER, RPA 是 起 始 变 元 ，0、1 和 # 是 终 
结 符 。 

按照 以 下 方法 ， 能 够 根据 文法 生成 其 所 描述 的 语言 的 每 一 个 字符 串 。 

1. 写 下 起 始 变 元 。 它 是 第 一 条 规则 左边 的 变 元 ， 除 非 另 有 指定 。 

2. 取 一 个 已 写 下 的 变 元 ， 并 找到 以 该 变 元 开始 的 规则 ， 把 这 个 变 元 替换 成 规则 右边 
的 字符 串 。 

3. 重复 步骤 2， 直 到 写 下 的 字符 串 没有 变 元 为 止 。 
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例如 ， 文 法 G 生成 字符 串 000# 111。 获 取 一 个 字符 串 的 替换 序列 称 为 派生 (derivation). 
文法 G1 AME AEB 000# 111 的 派生 过 程 为 
A >0A1 >00A11 >000A111 之 000B111 000 #111 
可 用 语法 分 析 树 (parse tree) 更 加 形象 地 描绘 这 一 派生 过 程 。 


图 2-1 给 出 了 G 的 一 棵 语法 分 析 树 。 3 


4 
用 上 述 方式 生成 的 所 有 字符 串 构 成 该 文法 的 语言 dan- l 
guage of the grammar), AJL(G:) 表示 文法 G1 的 语言 ， 可 以 
看 出 L(G1) 二 {0"#1"|n 宇 0}。 能 够 用 上 下 文 无 关 文法 生成 的 3 
语言 称 为 上 下 文 无 关 语 言 (CFL) 。 为 方便 起 见 ， 在 描述 一 个 | 


上 下 文 无 关 文法 时 ， 对 左边 变 元 相同 的 规则 采用 缩写 的 形式 ， |， AAG REF 
比如 ，A 一 0Al 和 A 一 B 缩写 成 一 行 A 一 0Al1|B, FE “|” 00 # 111 BYR 4} ERE 
表示 “或 ”。 
下 面 是 另 一 个 上 下 文 无 关 文法 (C2) 的 示例 ， 文 法 描述 了 一 个 英语 片断 : 
(句子) 一 (名 词 短 语 )《 动 词 短语 
《名 词 短 语 ) 一 (复合 名 词 )| (复合 名 词 )( 介 词 短 语 》X 
《动词 短语 ;一 (复合 动词 )| (复合 动词 (介词 短语 》X 
《介词 短语 ) 一 (介词 )( 复 合 名 词 》 
《复合 名 词 ) 习 ( 冠 词 )( 名 词 》 
《复合 动词 ?一 (动词 ?| (动词 (名 词 短语 》 
( 冠 词 ) 一 a|the 
(名 词 ) 一 boy | girl | flower 
(动词 ) 一 touches|likes|sees 
《介词 ?一 with 
文法 Gs 包含 10 个 变 元 〈 写 在 尖 括 号 内 的 词汇 ) 、27 个 终结 符 ( 标 准 的 英文 字母 加 上 
空格 符 ) 和 18 条 规则 。 下 面 是 工 (Cz) 中 的 3 个 字符 串 : 
a boy sees 
the boy sees a flower 
a girl with a flower likes the boy 
这 些 字符 串 都 可 以 由 文法 Go 派生 出 来 ， 下 面 是 第 一 个 字符 串 的 派生 : 
F) 二 (名 词 短 语 〉 《动词 短语 
一 (复合 名 词 》〈 动 词 短 语 》 
=> (ai) (Ai) (mi BIE) 
>a (名词) (动词 短语 
>a boy (动词 短语 》 
一 a boy (复合 动词 》 
>a boy (动词 》 
=a boy sees 


2.1.1 上 下 文 无 关 文法 的 形式 化 定义 
下 面 将 上 下 文 无 关 文 法 (CFG) 的 概念 形式 化 。 
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上 下 文 无 关 文 法 (context-free grammar) 是 一 个 4 元 组 (V,5,R,S), H 
1.V 是 一 个 有 穷 集合 ， 称 为 变 元 集 (variables), 
2. 王 是 一 个 与 V 不 相交 的 有 穷 集 合 ， 称 为 终结 符 集 (terminals). 
3. 尺 是 一 个 有 穷 规则 集 (rules) ， 每 条 规则 由 一 个 变 元 和 一 个 由 变 元 及 终结 符 组 成 的 
字符 串 构 成 。 
4. SEV 是 起 始 变 元 。 
设 u，v 和 w 是 由 变 元 及 终结 从 构成 的 字符 串 ，A 一 w 是 文法 的 一 条 规则 ， 称 xAv Æ 
成 (yield) uwv, WE uAv>uwy, WR u=v, MAGES ui ,us，… ,us ， 使 得 
u Sui Duz: SOU Sv 
其 中 k>0, WEK u 派生 (derivo v, WE u 之 ww。 该 文法 的 语言 是 (wed* | S Sw., 
在 文法 G1 中 ，V=(A,B),，z=(0,1,#}，S=A,R 是 上 面 提 到 的 示例 中 给 出 的 3 条 规 
则 。 在 文法 Gz 中 ， 
V= (AT), (4M AB), (HMA), 
(fil I), (REA), (LOD), 
(td), CR 《动词 y， <iq} 
Z 一 (ayb,c,…，z，”}， 符 号 ”“” 表 示 空 日 ， 它 放 在 每 个 单词 a、boy 等 的 后 面 ， 将 单词 
art e 
在 描述 一 个 文法 时 ， 通常 只 写 出 它 的 规则 。 出 现在 规则 左边 的 所 有 符号 都 是 变 元 ， 其 
余 的 符号 都 是 终结 符 ， 按 照 惯 例 ， 起 始 变 元 是 第 一 条 规则 左边 的 变 元 。 


2.1.2 上 下 文 无 天 文法 举例 


ep 考虑 文法 Gs 二 ({S),(a,b),R,S)， 其 中 规则 集 R 为 : 
S—>aSb|SS|e 
该 文法 生成 abab, aaabbb, aababb 等 字符 串 。 如 果 把 a 看 作 左 括号 “(”， 把 b 看 作 右 括 
号 “)”， 可 以 看 出 工 (Gs) 是 所 有 正常 艇 套 的 括号 字符 串 构 成 的 语言 。 注 意 规 则 右 部 可 能 
是 字 E i 
考虑 文法 Ga =(V,5,R,(EXPR)), 4H V= {EXPR}, (TERM), (FAC- 
TÖR}, S=fa,+,X5€,)}, M RW: 

(EXPR)—(EXPR) +(TFRM) | (TERM) 
(TERM)—(TERM) X (FACTOR) | (FACTOR) 
(FACTOR)—(<(EXPR)) |a 

文法 G4 可 以 生成 字符 串 a 十 aXa 和 (a 十 a) Xa。 它 们 的 语法 分 析 树 在 图 2-2 中 给 出 。 

编译 程序 把 用 程序 设计 语言 编写 的 代码 翻译 成 另 一 种 更 适合 机 器 执行 的 代码 。 编 译 程 
序 提取 被 编译 代码 的 语义 ， 这 一 过 程 称 为 语法 分 析 (parsing)。 在 关于 该 程序 设计 语言 也 
上 下 文 无 关 文 法 中 ， 编 译 代 码 的 意思 可 以 用 代码 的 语法 分 析 树 进行 表达 。 上 下 文 无 关 语 言 
的 算法 将 在 后 面 的 定理 7.14 和 问题 7. 22 中 讨论 分 析 。 

文法 G4 描述 程序 设计 语言 中 涉及 算术 表达 式 的 一 个 片断 。 观 察 图 2- 2 中 的 语法 分 析 
树 如 何 对 运算 进行 “分 组 ”。 关 于 a 十 aXa 的 语法 分 析 树 把 运算 符 X 连 同 它 的 运算 对 象 
(后 2 个 a) 作为 运算 符 十 的 一 个 运算 对 象 ， 而 在 关于 (a 十 a) Xa 的 语法 分 析 树 中 ， 分 组 方 
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(EXPR) 
\ 
(TERM) 
JS 
(TERM) 
FACTOR 
(TERM) (FACTOR) | (FACTOR) 
AEXPR) 
dii EXPR V TERM) 
(FACTOR) / | 
(FACTOR) ss (FACTOR) 
FACTOR 
\ 
x a 《 2 4 a ) x 8 





图 2-2 关于 字符 串 a 十 aXa 和 (ata) Xa 的 语法 分 析 树 


式 正好 相反 。 这 种 分 组 方式 符合 标准 的 乘法 优先 于 加 法 和 用 括号 打破 这 种 优先 的 规定 ， 文 
法 G4 的 设计 体现 了 这 种 优先 关系 。 s 


2.1.3 设计 上 下 文 无 关 文 法 


与 在 1. 1 市 中 讨论 有 穷 目 动机 的 设计 一 样 ， 设 计 上 下 文 无 关 文 法 需要 创造 力 。 因 为 读 
者 更 习惯 为 指定 的 任务 给 一 台 机 器 编程 ， 而 不 是 用 文法 去 描述 语言 ， 所 以 设计 上 下 文 无 关 
文法 比 设计 有 穷 自动 机 更 加 环 手 。 当 你 面 对 构 造 一 个 CFG 的 问题 时 ， 可 以 单独 使 用 或 混 
合 使 用 下 述 技 巧 。 
首先 ， 化 繁 为 简 。 解 决 几 个 较 简单 的 问题 常常 比 解决 一 个 复杂 的 问题 容易 ， 许 多 CFL 
是 由 几 个 较 简 单 的 CFL 合并 成 的 。 如 果 你 要 为 一 个 CFL 构造 CFG， 而 这 个 CFL 可 以 分 
成 几 个 较 简 单 的 部 分 ， 那么 就 把 它 分 成 几 部 分 ， 并 且 分 别 构造 每 一 部 分 的 文法 。 这 几 个 文 
法 能 够 很 容易 地 合并 在 一 起 ， 构 造 出 原先 那个 语言 的 文法 ， 我 们 需要 做 的 只 是 把 它们 的 规 
则 都 放 在 一 起 ， 再 加 入 新 的 规则 SS) |Sz|…|S ， 其 中 Si,Sz,…，, Se 是 各 个 文法 的 起 始 
变 元 。 
例如 ， 为 得 到 语言 {071"|n>0} U{1"0"|n>0} 的 文法 ， 先 构造 语言 (0"1"|n>0} 
的 文法 
Si70Si lle 
和 语言 {1"0" | n>0} 的 文法 
Sz 一 1Sz0|e 
然后 加 上 规则 SSi |S* ， 得 到 所 求 的 文法 : 
S— Sı | Se 
Si > 05,1 | 
Ss—> 1620 |e 
其 次 ， 利 用 正则 。 如 果 一 个 语言 碰巧 是 正则 的 ， 可 先 构 造 它 的 DFA， 再 构造 它 的 
CFG 就 容易 了 。 通 过 下 述 方法 可 以 把 任何 一 台 DFA 转换 成 等 价 的 CFG: 对 于 DFA 的 每 
一 个 状态 gq;， 指 定 一 个 变 元 R;。 如 果 el a) =q, 是 DFA 中 的 一 个 转移 ， 则 把 规则 R> 
aR; 加 入 CFG; WR q; 是 DFA 的 接受 状态 ， 则 把 规则 Rime 加 入 CFG. Hq, Æ DFA 的 
起 始 状态 ， 则 取 Ro 作为 CFG 的 起 始 变 元 。 可 以 验证 所 得 到 的 CFG 生成 的 语言 与 DFA 识 
别 的 语言 相同 。 
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再 次 ， 考 察 子 串 。 某 些 上 下 文 无 关 语言 中 的 字符 串 有 两 个 “相互 联系 ”的 子 串 ， 为 了 
检查 这 两 个 子 串 中 的 一 个 是 否 正 好 对 应 于 另 一 个 ， 识 别 这 种 语言 的 机 器 需要 记 住 其 中 一 个 
子 串 的 信息 ， 而 这 个 信息 是 无 界 的 。 例 如 ， 在 语言 (07l"|nS0) 中 就 出 现 这 种 情况 WA 
了 检查 字符 串 中 0 的 个 数 是 否 等 于 1 的 个 数 ， 机 占 需 要 记 住 0 的 个 数 。 对 于 这 种 情况 ， 可 
以 使 用 R>uRw 形式 的 规则 ， 它 产生 的 字符 串 中 包含 u 的 部 分 对 应 包含 v 的 部 分 。 

最 后 ， 利 用 递归 。 在 更 复杂 的 语言 中 ， 字 符 串 可 能 包含 一 定 的 结构 ， 而 这 种 结构 又 递 
归 地 作为 另 一 种 〈 或 者 同一 种 ) 结构 的 一 部 分 出 现 。 例 2. 3 生成 算术 表达 式 的 文法 中 就 有 
这 种 情况 ， 每 次 出 现 符号 a， 就 会 递归 地 出 现 一 个 用 括号 括 起 来 的 完整 的 算术 表达 式 来 替 
换 。 为 了 得 到 这 样 的 结果 ， 把 生成 这 种 结构 的 变 元 放 在 规则 中 这 种 结构 对 应 可 能 出 现 递归 
的 地 方 。 


2.1.4 歧义 性 


有 时 在 一 个 文法 中 能 够 用 几 种 不 同 的 方式 产生 出 同一 个 字符 串 ， 这 样 的 字符 串 有 几 株 
不 同 的 语法 分 析 树 ， 对 应 几 个 不 同 的 含义 。 这 样 的 结果 对 于 某 些 应 用 可 能 是 不 希望 见 到 
的 ， 例 如 ， 对 于 程序 设计 语言 ， 一 个 程序 应 该 只 有 唯一 的 解释 。 
如 果 文 法 以 不 同 的 方式 产生 同一 个 字符 串 ， 则 称 文 法 歧义 地 产生 这 个 字符 串 。 如 果 一 
个 文法 卜 义 地 产生 某 个 字符 串 ， 则 称 这 个 文法 是 歧义 的 。 例 如 ， 对 于 文法 Gs: 
(EXPR)—(EXPR) + <(EXPR) | (EXPR) X (EXPR) | ((EXPR)) |a 
XP IK aA PB a 十 axa。 图 2-3 给 出 它 的 两 棵 不 同 的 语法 分 析 树 。 


(EXPR) (EXPR) 


J \ x ho % 

(EXPR) (EXPR) (EXPR) (EXPR) 
P TARN 
(EXPR) | (EXPR) (EXPR) |(EXPR) 
| \ / \ 
a + a x a a + a x a 


Al 2-3 字符 串 a 十 aXa 在 文法 G: 中 的 两 棵 语法 分 析 树 


这 个 文法 没有 把 握 住 通常 的 优先 级 关系 ， 可 能 把 十 放 在 了 X 的 前 面 ， 也 可 能 反 过 来 
把 X 放 在 了 十 的 前 面 。 而 前 面 提 到 的 文法 G4 能 产生 相同 的 语言 ， 但 其 产生 的 每 一 个 字符 
串 只 有 一 棵 唯一 的 语法 分 析 树 。 因 此 ，G4 是 非 歧义 的 ， 而 Gs 是 歧义 的 。 

本 节 开 始 部 分 给 出 的 文法 Gz 是 歧义 文法 的 另 一 个 例子 。 句 子 “the girl touches the 
boy with the flower” 有 两 个 不 同 的 派生 。 在 练习 2.8 中 要 求 给 出 它 的 两 棵 语法 分 析 树 ， 
并 且 观 察 用 这 两 种 方式 读 这 个 句子 时 其 表达 的 含义 之 间 的 关系 。 

现在 把 歧义 性 的 概念 形式 化 ， 一 个 文法 歧义 地 产生 一 个 字符 串 的 意思 是 指 ， 该 字符 串 
有 两 棵 不 同 的 语法 分 析 树 ， 而 不 是 两 种 不 同 的 派生 ， 两 种 不 同 的 派生 可 能 仅仅 是 替换 变 元 
的 次 序 不 同 ， 而 不 是 整个 结构 的 不 同 。 为 了 专注 于 结构 ， 定 义 一 种 以 固定 次 序 替 换 变 元 的 
派生 类 型 ， 对 于 文法 G 中 的 一 个 字符 串 z 的 派生 ， 如 果 在 每 一 步 都 是 替换 最 左边 剩 下 的 
变 元 ， 则 称 这 个 派生 是 最 左派 生 〈leftmost derivation) 。 在 前 面 定义 2.1 中 给 出 的 派生 是 
一 个 最 左派 生 ，。 

CITED 如 采 字 符 囊 ww 在 上 下 文 无 关 文 法 G 中 有 两 个 或 两 个 以 上 不 同 的 最 左派 
+, Uik GEXH (ambiguously) 产生 字符 串 w， 如 果 文 法 G 歧 义 地 产生 菜 个 字符 串 ， 
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则 称 G 是 歧义 的 (ambiguous)。 

有 时 对 于 一 个 歧义 文法 能 够 找到 一 个 产生 相同 语言 的 非 歧 义 文法 。 但 是 ， 某 些 上 下 文 
无 关 语言 只 能 用 歧义 文法 产生 ， 称 这 样 的 语言 为 固有 歧义 的 (inherently ambiguous), fA 
题 2. 41 要 求证 明 语 言 {aibict|i 二 j 或 j= 二 k} 是 固有 歧义 的 。 


2.1.5 乔 姆 斯 基 范 式 


在 使 用 上 下 文 无 关 文 法 时 ， 简 化 的 形式 往往 更 为 方便 ， 一 种 最 简单 、 最 有 用 的 形式 称 
为 乔 姆 斯 基 范 式 。 在 第 4 章 和 第 7 章 中 ， 当 设计 使 用 上 下 文 无 关 文法 的 算法 时 ， 将 会 发 现 
乔 姆 斯 基 范 式 的 用 途 。 

称 一 个 上 下 文 无 关 文 法 为 乔 姆 斯 基 范 式 (Chomsky normal form)， 如 果 
它 的 每 一 个 规则 具有 如 下 形式 : 

ABC 

A—>a 
RP, a 是 任意 的 终结 符 ，A、B 和 C 是 任意 的 变 元 ， 且 已 和 C 不 能 是 起 始 变 元 。 此 外 ， 
允许 规则 Sree, HPS 是 起 始 变 元 。 

任 一 上 下 文 无 关 语 言 都 可 以 用 一 个 乔 姆 斯 基 范 式 的 上 下 文 无 关 文 法 产生 。 

证 明 思 路 ”可 以 将 任 一 上 下 文 无 关 文 法 G 转换 成 乔 姆 斯 基 范 式 ， 转 换 时 分 几 个 阶段 把 
不 符合 要 求 的 规则 替换 成 等 价 的 符合 要 求 的 规则 。 首 先 ， 添加 一 个 新 的 起 始 变 元 ， 然 后 ， 
删除 所 有 形 如 A->e He 规则 ， 再 删除 所 有 形 如 A 一 B 的 单一 规则 。 在 删除 时 ， 要 对 文法 
做 适当 的 弥补 ， 以 确保 仍然 产生 相同 的 语言 。 最 后 ， 把 所 有 留 下 来 的 规则 转换 成 适当 的 
形式 。 

证 明 首先 ， 添加 一 个 新 的 起 始 变 元 So 和 规则 So>S, HPS 是 原来 的 起 始 变 元 。 
这 样 可 以 保证 起 始 变 元 不 出 现在 规则 的 右边 。 

第 二 阶段 ， 考 虑 所 有 的 规则。 删除 一 条 e 规则 A 一 e， 这 里 A 不 是 起 始 变 元 ， 然 后 对 
在 规则 右边 出 现 的 每 一 个 A， 删 去 这 个 A 后 得 到 一 条 新 的 规则 。 换 言 之 ， 如 果 R>uAv 是 
一 条 规则 ， 其 中 u 和 w 是 变 元 和 终结 符 的 字符 串 ， 则 添加 规则 Ruvu., Xt A 的 每 一 次 出 现 
都 如 此 进行 ， 因 而 对 于 规则 Re>uAvAw, BY R-uvAw, R>uAvw A R-uvw. WR 
有 规则 R 一 A， 则 要 添加 Re， 除非 前 面 已 经 删除 过 规则 R 一 e。 重 复 进行 上 述 步 骤 ， 直 至 
删除 所 有 不 包括 起 始 变 元 的 s 规则 。 

第 三 阶段 ， 处 理 所 有 的 单一 规则 。 删 除 一 条 单一 规则 A 一 B， 然 后 ， 只 要 有 一 条 规则 
Bu， 就 要 添加 规则 A 一 w， 除 非 A—>u 是 已 在 前 面 被 删除 的 单一 规则 。 和 前 面 一 样 ，u 是 
变 元 和 终结 符 的 字符 串 。 重 复 上 述 步 又 ， 直 至 删除 所 有 的 单一 规则 。 

最 后 ， 把 所 有 留 下 的 规则 转换 成 适当 的 形式 。 把 每 一 条 规则 Au uzur 替换 成 规则 
Au A), Aı—>uzA2, Az—u3A35 **, Ar—2—>ur—iuk 其 中 k23, BT u 是 一 个 变 元 或 终 
watt, Ai 是 新 的 变 元 。 用 新 变 元 Ui 替换 上 面 规则 中 的 终结 符 u;， 并 增加 规则 Ui —>ui # 

设 Ge 是 下 述 CRFG， 用 刚才 给 出 的 转换 过 程 把 它 转换 成 乔 姆 斯 基 范 式 。 下 面 
用 一 系列 文法 规则 说 明 转 换 的 步 又， 其 中 用 黑体 写 的 规则 是 新 添加 进来 的 规则 ， 用 带 阴 影 
的 字 写 的 规则 是 刚刚 删 掉 的 规则 。 

1. 原先 的 CFG Gs 在 左边 给 出 。 运 用 第 一 步 引 入 新 起 始 变 元 后 得 到 的 结果 在 右边 显示 。 
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So 一 人 

S~ASA|aB S—~ASA|aB 
A—>B|S A—>B|S 
B>ble B—>ble 

2. 左边 给 出 删除 e 规则 Boe BWR, AWA MMR Ame 后 的 结果 。 
SoS SoS 
S~ASA|aBla S~ASA|aB|a|SA|AS|S 
A—>B|Sle A—>B|S|e 
B—>ble B—b 

3a. 左边 给 出 删除 单一 规则 SS 后 的 结果 ， 右 边 给 出 删除 So 一 S 后 的 结果 。 
So>S So—S|ASA|aBl\a|SA|AS 
S—~ASA|aB|a|SA|AS|S S~ASA|aBl|a|SA|AS 
A>B|S ABIS 
B—>b B—>b 

3b. 删除 单一 规则 A 一 B 和 A 一 5S。 
So~ASA|aBla|SA|AS So ~ASA|aBla|SA|AS 
S~ASA|aB|a|SA|AS S—ASA|aB|a|SA|AS 
A—>B|S|b A>S|b|ASA|aB|a|SA|AS 
B—>b B—b 


4. 添加 新 的 变 元 和 规则 ， 把 留 下 的 所 有 规则 转换 成 合适 的 形式 。 最 后 得 到 的 符合 乔 
姆 斯 基 范 式 的 文法 等 价 于 Go. (按照 定理 2.6 证明 中 的 转换 过 程 ， 应 把 So 一 ASA 替换 成 
So>AA, Al Ai 一 SA; 把 S~ASA RM S—>AA2 Fl A, 一 SA; 把 A 一 ASA 替换 成 A 一 
AA; 和 As 一 SA。 其 中 Al ，A* 和 As 是 新 引入 的 变 元 ， 这 里 作 了 化 简 , fh A, A: 和 As 
合并 成 一 个 变 元 并 将 这 些 规则 以 Ua 表示 。 一 一 译 者 注 ) 

So—> AA; | UB |a| SA | AS 

S— AA; | UB |a|SA | AS 

A—> b | AA; | UB |a| SA | AS 

Aı—> SA 

U— a 

B—> b n 


2.2 下 推 自动 机 


本 节 介 绍 一 种 称 为 下 推 自动 机 (pushdown automata) 的 计算 模型 ， 它 很 像 非 确定 型 
有 穷 自动 机 ， 但 是 它 有 一 个 称 为 栈 (stack) 的 额外 设备 。 栈 在 控制 器 的 有 限 存 储量 之 外 提 
供 了 附加 的 存储 ， 使 得 下 推 自 动机 能 够 识别 某 些 非 正 则 语言 。 

下 推 目 动机 在 能 力 上 与 上 下 文 无 关 文 法 等 价 。 因 此 ， 在 证 明 一 个 语言 是 上 下 文 无 关 的 
时 候 ， 有 两 种 选择 : 可 以 给 出 生成 它 的 上 下 文 无 关 文 法 ， 或 者 给 出 识别 它 的 下 推 自动 机 。 
某 些 语 言 用 文法 生成 器 描述 要 容易 些 ， 另 一 些 用 自动 机 识别 器 描述 更 容易 。 

图 2-4 是 一 台 有 穷 目 动机 的 示意 图 ， 控 制 器 表示 状态 和 转移 果 数 ， 带 子 存 放 输 入 字符 
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P, WARNMALME, CKT- TERRAS 
如 果 在 此 基础 上 加 一 个 栈 ， 我 们 得 到 一 台 下 推 目 动 机 的 示意 图 ， 如 图 2- 5 所 示 。 





状态 
BRODET 


图 2-4 一 台 有 穷 自 动机 的 示意 图 图 2-5 一 台 下 推 自动 机 的 示意 图 


下 推 自动 机 (PDA) 能 够 把 符号 写 到 栈 上 并 在 随后 读 取 它 ， 向 栈 中 写 和 一 个 符号 将 把 
栈 中 其 他 的 所 有 符号 “下 推 ?>。 在 任何 时 刻 ， 可 以 读 和 删 去 栈 顶 的 符号 ， 其 余 的 符号 向 上 
移动 。 向 栈 写 一 个 符号 ， 和 常常 称 为 推 入 〈pushing) 这 个 符号 ， 而 删除 一 个 符号 称 为 弹出 
(popping) 它 。 需 要 注意 的 是 ， 对 栈 的 所 有 访问 ， 无 论 读 写 ， 都 只 能 在 栈 顶 进行 ， 换 言 
之 ， 栈 是 一 个 “先进 后 出 ”的 存储 设备 。 如 果 把 某 个 信息 写 到 栈 上 ， 然 后 又 把 另外 一 些 信 
息 写 到 栈 上 ， 那 么 前 面 写 的 信息 变 成 不 可 访问 的 ， 一 直到 在 其 后 面 写 和 的 信息 全 部 被 删除 
Ay 1k 

可 以 用 自助 餐厅 服务 台 上 的 盘子 来 解释 栈 ， 一 又 盘子 放 在 弹 得 上 ， 把 一 个 新 盘子 放 在 
这 笃 盘 子 的 顶 上 时 ， 它 下 面 的 盘子 依次 向 下 移动 ， 下 推 自动 机 的 栈 就 像 一 琶 盘 子 ， 每 个 盘 
子 上 写 着 一 个 符号 。 

栈 的 作用 体现 在 它 能 保存 无 限 的 信息 量 。 有 穷 自 动机 (DFA) 不 能 用 它 的 有 限 存 储 保 
存 大 数据 量 的 字符 串 ， 所 以 它 不 能 识别 语言 (0"1"|n>0}, m PDA 可 以 用 栈 保存 它 看 见 
的 0 的 个 数 ， 从 而 能 够 识别 这 个 语言 ， 因 此 ， 栈 的 无 界 性 使 得 PDA 能 够 保存 大 小 没有 限 
制 的 数 。 下 面 非 形式 化 地 描述 关于 语言 {(0"1"|n>0} 的 PDA 如 何 工作 : 

读 取 输 入 串 的 符号 ， 每 读 一 个 0， 把 它 推 入 栈 ， 一 旦 看 见 1 之 后 ， 每 读 一 个 1， 把 一 
个 0 弹出 栈 ， 当 栈 中 的 0 被 清空 时 恰好 读 完 输入 串 ， 则 接受 这 个 输入 。 如 果 在 还 有 1 没有 
读 的 时 候 栈 已 变 空 ， 或 者 在 栈 中 还 有 0 的 时 候 1 已 经 读 完 了 ; 或 者 0 出 现在 1 的 后 面 ， 则 
拒绝 这 个 输入 。 

下 推 自动 机 可 以 是 非 确定 型 的 ， 确 定型 下 推 自 动机 与 非 确 定型 下 推 自动 机 在 语言 识别 
能 力 上 不 相同 。 在 2. 4 节 ， 我们 将 看 到 一 些 非 确定 型 下 推 自 动机 能 识别 但 确定 型 下 推 目 动 
机 不 能 识别 的 语言 。 我 们 将 在 例 2.10 和 例 2.11 给 出 需要 非 确 定型 自动 机 才能 识别 的 语 
言 。 确 定型 有 穷 自动 机 与 非 确定 型 有 穷 自动 机 能 识别 相同 的 语言 ， 但 对 于 下 推 自动 机 却 有 
区 别 。 由 于 非 确定 型 下 推 自 动机 等 价 于 上 下 文 无 关 文法 ， 所 以 我 们 集中 讨论 非 确 定型 下 推 
自动 机 。 


2.2.1 下 推 自动 机 的 形式 化 定义 


除 栈 之 外 ， 下 推 自动 机 的 形式 化 定义 类 似 于 有 穷 自动 机 。 栈 是 一 个 存放 符号 的 设备 ， 
这 些 符号 取 自 某 个 字母 表 。 机 器 对 于 它 的 输入 和 栈 ， 可 以 使 用 不 同 的 字母 表 ， 因 此 需要 同 
时 指定 一 个 输入 字母 表 三 和 一 个 栈 字 母 表 卫 。 

任何 自动 机 的 形式 化 定义 的 核心 都 是 转移 函数 ， 因 为 要 用 它 描述 自动 机 的 动作 。 给 定 
3. 一 >U{e}, TSTU (e), HERABE LRA XE X.. FH, ESWS, F- 
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个 读 到 的 输入 符号 和 栈 顶 的 符号 决定 了 下 推 自动 机 的 下 一 个 动作 。 这 两 个 符号 都 可 以 是 s， 
使 机 器 能 够 在 不 读 输入 符号 或 者 不 读 栈 中 符号 的 情况 下 做 动作 。 

关于 转移 函数 的 值 域 ， 需要 考虑 在 特定 情形 下 人 允许 自动 机 做 什么 。 它 能 够 进入 某 个 新 
的 状态 并 可 能 在 栈 顶 写 入 一 个 符号 。 通 过 返回 Q 的 一 个 成 员 和 3。 的 一 个 成 员 ， 即 QXT 
的 一 个 成 员 ， 肾 数 6 可 以 指出 这 个 动作 。 由 于 在 这 个 模型 中 允许 非 确 定性 ， 所 以 可 能 有 和 若 
干 个 合法 的 下 一 个 动作 ， 转 移 函 数 通过 返回 QXT 的 一 个 子 集 ， 即 P(QXT)〉 的 一 个 成 员 
来 体现 转移 动作 的 非 确 定性 。 所 有 这 些 子 集合 并 在 一 起 ， 得 到 转移 函数 6 的 形式 为 6: 
X35. 41, PUQxT, ). 

下 推 自动 机 Cpushdown automaton) 是 6 元 组 (Q,Y, 有 ,8,qi, 下 )， 这 里 
QET fF 都 是 有 穷 集合 ， 并 且 

1.Q 是 状态 集 。 

2. 上 5 是 输入 字母 表 。 

3. 古 是 栈 字 母 表 。 

4.0:QX>. XI 一 P(QXT.) 是 转移 函数 。 

D+ qo 人 EQ 是 起 始 状 态 。 

6. FCQ 是 接受 状态 集 。 

一 台 下 推 自动 机 M=(Q,5,7.60.q.F) 的 计算 过 程 如 下 : 它 接受 输入 w， 如 果 能 够 
把 ww 写 成 w= 二 wiwz…*wm， 这 里 每 一 个 w;€ 5， 并 且 存 在 状态 序列 ro ,ri,…,rmEQ 和 
字符 串 序列 50 ,s1 ，… ,sm ET* 满足 下 述 3 个 条 件 : 

l. ro 二 qo H so 二 e， 该 条 件 表示 M 从 起 始 状态 和 空 栈 开始 。 

2. 对 于 i=0,°-,m—1, A (ri+1,6) €d(ri,witi,a), HP s;=at,s;+1 “bta bET, 
和 tET* 。 该 条 件 说 明 M 在 每 一 步 都 完全 按照 当时 的 状态 、 栈 顶 符号 和 下 一 个 输入 符号 
动作 。 

3. rm 下 ， 该 条 件 说 明 在 输入 结束 时 出 现 一 个 接受 状态 。 
则 字符 串 s 是 M 在 计算 的 接受 分 支 中 的 栈 内 容 序 列 。 


2.2.2 下 推 自 动机 举例 


下 面 是 前 面 描述 的 识别 语言 (071"|n>0} 的 PDA 的 形式 化 定义 。 令 Mi = 
(Q,2,T,0,9g) of), 其 中 


6 由 下 表 给 出 ， 表 中 空 日 项 表示 2 。 
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也 可 以 用 状态 图 描述 PDA, WA 2-6 和 图 2-7、 图 2-8 所 示 。 这 种 图 类 似 于 描述 有 穷 
自动 机 的 状态 图 ， 但 要 做 一 些 修 改 ， 使 得 它 能 说 明 PDA 在 从 一 个 状态 转移 到 另 一 个 状态 
时 如 何 使 用 栈 。 用 “ac，2%-~>c” 表 示 当 机 器 从 输入 中 读 到 a 时 
可 以 用 c 替换 栈 顶 的 符号 5。a、2 和 ec 中 的 任何 一 个 都 可 以 是 
e 。 如 果 a 是 es， 则 机 器 做 这 个 转移 ， 而 不 读 取 输入 中 的 任何 符 
号 。 如 果 4 是 es， 则 机 器 做 这 个 转移 ， 而 不 读 栈 中 的 任何 符号 ， 
也 不 从 栈 中 弹出 任何 符号 。 如 果 “ 是 es， 则 机 器 做 这 个 转移 ， 
而 不 在 栈 中 写 任 何 符号 。 出 

PDA 的 形式 化 定义 没有 提供 检验 空 栈 的 直接 手段 。 这 台 2-6 识别 (0"1” | "之 0} 
PDA 一 开始 把 一 个 特殊 符号 S 放 人 栈 中 ， 就 能 够 起 到 检验 空 BY PDA My 的 状态 图 
栈 的 作用 ， 当 机 器 再 次 看 见 $ 时 ， 就 知道 栈 实 际 上 已 经 空 了 。 今 后， 在 PDA 的 非 形式 化 
描述 中 用 这 种 方法 判断 空 栈 。 

类 似 地 ，PDA 不 能 直接 检验 是 否 到 达 输 入 的 末端 ， 对 于 这 台 PDA， 只 有 当 它 位 于 输 
入 的 末端 时 ， 接 受 状态 才 起 作用 ， 这 就 能 够 起 到 同样 的 效果 。 于 是 ， 从 现在 起 ， 假 设 
PDA 能 够 检验 是 否 到 达 输 入 的 末端 ， 并 且 可 以 用 这 种 方式 实现 。 

CEED 这 个 例子 给 出 一 台 识 别 下 述 语言 的 PDA Mo: 

faibict |i j,k >0 H i=j Ri=k} 

非 形式 化 地 表示 ， 识 别 该 语言 的 PDA 先 读 a， 并 且 把 a 推 人 栈 。 当 读 完 a 时， 机 器 把 它们 
全 部 放 到 栈 中 ， 以 便 能 够 把 它们 与 b 或 进行 匹配 。 由 于 机 器 不 知道 下 面 a 是 与 b 匹配 还 
是 与 < 匹 配 ， 需 要 想 点 办 法 ， 在 这 里 迟早 要 用 到 非 确定 性 。 

利用 非 确定 性 ， 这 台 PDA 可 以 猜想 a 是 与 b 匹配 还 是 与 c 匹配 ， 如 图 2-7 所 示 。 设 
想 机 器 有 两 个 非 确定 性 的 分 支 ， 每 一 种 可 能 的 猜想 是 一 个 分 支 。 如 果 有 一 个 匹配 成 功 ， 则 
对 应 的 分 支 接受 ， 从 而 整个 机 器 接受 。 问 题 2. 27 要 求证 明 非 确定 性 是 用 PDA 识别 这 个 语 
言 所 不 可 缺少 的 。 








a, Ea b, s 一 8 C, 3 一 ”8 


图 2-7 PDA M: 的 状态 图 ，Ms 识别 {aibict|i,j,k 宇 909， 和 且 i=j Mi=k} =” 


给 出 一 台 识 别 语言 {ww®|we{0,1}*} 的 PDA Ms。 注 意 w* 表 示 倒 写 的 
w., XA PDA 的 非 形 式 化 描述 和 状态 图 如 下 : 

开始 时 ， 把 读 到 的 符号 推 人 栈 中 ， 在 每 一 步 非 确定 性 地 猜想 已 经 到 达 字 符 串 的 中 点 ， 
然后 变 成 把 读 到 的 每 一 个 符号 弹出 栈 ， 检 查 在 输入 中 和 在 栈 顶 读 到 的 符号 是 否 一 样 。 如 宁 
它们 总 是 一 样 的 ， 并 且 当 输入 结束 时 栈 同 时 被 清空 ， 则 接受 ; 否则 拒绝 。 
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这 人 台 机 需 的 状态 图 如 图 2- 8 Aras. 
问题 2. 28 证 明 识 别 这 个 语言 需要 一 台 非 确定 型 PDA, 


2.2.3 与 上 下 文 无 关 文 法 的 等 价 性 


本 节 证 明 上 下 文 无 关 文法 与 下 推 自 动机 在 能 力 上 是 等 
价 的 ， 它 们 都 能 够 描述 上 下 文 无 关 语言 类 。 下 面 要 说 明 如 
何 把 任意 一 个 上 下 文 无 关 文 法 转换 成 能 识别 相同 语言 的 下 
推 自 动机 ， 以 及 反 过 来 把 任意 一 台 下 推 自 动机 转换 成 产生 
相同 语言 的 上 下 文 无 关 文 法 。 由 前 面 的 定义 可 知 上 下 文 无 ”图 2-8 PDA M: MRSA, Ms 
关 语 言 是 能 用 上 下 文 无 关 文法 描述 的 语言 ， 因 此 本 节 的 目 Ba (ww lwe {0,1)*) 
标 是 证 明 下 述 定理 。 

ED 一 个 语言 是 上 下 文 无 关 的 ， 当 上 且 仅 当 存 在 一 台 下 推 自动 机 识别 它 。 

和 通常 对 待 “ 当 且 仅 当 ” 型 定理 一 样 ， 有 两 个 方向 要 证 明 ， 在 本 定理 中 ， 这 两 个 方向 
都 是 很 有 意思 的 ， 首 先 证 明 比 较 容易 的 从 左 到 右 的 方向 。 

全 上 网 几 钨 如 果 一 个 语言 是 上 下 文 无 关 的 ， 则 存在 一 台 下 推 自动 机 识别 它 。 

证 明 思 路 设 A 是 一 个 CFEL， 根 据 定 义 ， 存 在 一 个 CFG G 产生 它 。 我 们 要 说 明 如 何 
把 G 转换 成 一 台 等 价 的 PDA P。 

通过 确定 是 否 存在 关于 输入 w 的 派生 ， 当 G 产生 w 时 ，PDA P 接受 这 个 输入 。 记 得 
派生 就 是 当 文法 产生 一 个 字符 串 时 所 做 的 替换 序列 ， 派 生 的 每 一 步 产 生 一 个 变 元 和 终结 符 
的 中 间 字 符 串 Cintermediate string)。 设 计 P， 以 确定 是 否 有 一 系列 使 用 G 的 规则 替换 ， 
能 够 从 起 始 变 元 导出 w. 

检验 是 否 有 关于 w 的 派生 的 困难 在 于 判断 要 做 的 替换 ，PDA 的 非 确定 性 使 得 它 能 够 
猜想 出 正确 的 替换 序列 ， 在 派生 的 每 一 步 ， 非 确定 地 选择 关于 某 个 变 元 的 一 条 规则 ， 并 且 
对 这 个 变 元 做 蔡 换 。 

PDA P 开始 时 把 起 始 变 元 写 人 它 的 栈 ， 一 个 接 一 个 地 做 替换 ， 经 过 一 系列 的 中 间 字 
符 串 ， 最 终 它 可 能 到 达 一 个 仅 含 有 终结 符 的 字符 串 ， 这 表示 它 用 文法 G 派生 出 一 个 字符 
串 。 如 果 这 个 字符 串 与 它 接收 到 的 输入 相同 ， 则 P 接受 它 。 

在 PDA 上 实现 上 述 策略 还 需要 再 想 点 办 法 ， 需 要 知道 当 PDA 一 步 一 步 地 进行 时 ， 它 
如 何 存储 中 间 字 符 串 。 直 接 使 用 栈 存 储 每 一 个 中 间 字 符 串 是 一 个 诱 人 的 想法 ， 但是， 这 个 
想法 是 行 不 通 的 ， 因 为 PDA 必须 找到 在 字符 串 中 的 变 元 并 且 对 它 作 替换 ,但 PDA 只 能 够 
访问 栈 顶 符号 ， 它 可 能 是 一 个 终结 符 ， 而 不 是 变 元 。 解 决 这 个 问题 的 方法 是 在 栈 中 只 保存 
中 间 字 符 串 的 一 部 分 : 中 间 字 符 串 中 从 第 一 个 变 元 开始 的 所 有 符号 。 第 一 个 变 元 前 面 的 终 
结 符 都 恰好 与 输入 串 中 的 符号 匹配 。 图 2- 9 给 出 | 控制 器 
PDA PF: Ea 












P 的 非 形式 描述 如 下 : 四 
1. 把 标记 符 $ 和 起 始 变 元 放 人 栈 中 。 us / 
2. BER FRA: 01A1A0 
a. 如 果 栈 顶 是 变 元 A， 则 非 确定 地 选择 一 个 关于 图 2-9 了 表示 中 间 字 符 串 


A 的 规则 ， 并 且 把 A 替换 成 这 条 规则 右边 的 01A1A0 的 方式 
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字符 串 。 
b. 如 果 栈 顶 是 终结 符 a， 则 读 取 下 一 个 输入 符号 ， 并 且 把 它 与 a 进行 比较 。 如 果 它 们 
匹配 ， 则 重复 ， 如 果 它 们 不 匹配 ， 则 这 个 非 确 定性 分 支 拒 绝 。 
c. 如 果 栈 顶 是 符号 $ ， 则 进入 接受 状态 ， 如 果 此 刻 输 入 已 全 部 读 完 ， 则 接受 这 个 输 
A 
证 明 下 面 形式 化 地 给 出 下 推 自动 机 P=(Q,5,70.0.q,..°7F) 的 构造 细节 。 为 使 构造 
更 清楚 一 些 ,， 采 用 一 种 缩写 记号 表示 转移 邑 数 ， 用 这 种 记号 方式 ， 机 器 能 够 一 步 把 一 个 字 
符 串 写 和 信 栈 内 。 同 时 引入 附加 的 状态 ， 实 现 每 次 写 入 这 个 字符 串 的 一 个 符号 ， 从 而 模拟 出 
一 次 写 入 字符 串 的 动作 。 在 下 述 形 式 构造 中 实现 了 这 样 的 模拟 。 
it q Mr 是 PDA 的 状态 ,a RFs... 属于 了 e。 我 们 要 求 PDA 读 a 并 且 弹 出 s 时 ， 
从 g 到 r， 而 且 要 它 同 时 把 整个 字符 串 uuu HEAR. WU RMIT: 引入 新 
的 状态 g,,…,q,_1!， 并 且 令 转移 艺 数 如 下 : 
6(g,a,5) 包 含 (g) su) 
OGq, seve) = (gy rui) 
OC gs 1€,€) = { (gs ruiz)? 


By vest? = (Cran 

使 用 记号 (r,u)E6(g,a,s) 表示 当 g 是 P 的 状态 ,a 是 下 一 个 输入 符号 以 及 s 是 栈 顶 
符号 时 ，PDA P 能 够 读 a 和 弹出 ss， 然 后 把 字符 串 u HEA 
栈 和 转移 到 状态 >。 图 2- 10 形象 地 描述 了 这 个 动作 的 

P HRERS {lart > Toop laco) UE, RB ERK 
现 刚 才 描 述 的 缩写 所 需要 的 状态 集合 ， 开 始 状 态 为 daan’ 
只 有 一 个 接受 状态 gets 

转移 函数 定义 如 下 。 从 初始 化 栈 开始 ， 把 符号 $| 和 5S 图 2-10 缩写 (rs xyz) € 
推 人 栈 ， 实 现 步 又 1 的 非 形式 描述 是 : 6 uane) = gmas) WI 
{(qioop，S$ )}， 然 后 进行 步骤 2 主 循环 中 的 转移 。 

首先 ， 处 理 情 况 〈a)， 这 时 栈 顶 是 一 个 变 元 。 令 Soop A) {Coop w) l A>w ÆR 
中 的 一 条 规则 }。 

其 次 ， 处 理 情况 (b)， 这 时 栈 顶 是 一 个 终结 符 。 令 SCqioo 44) 二 {(qi00, ;Ee)}。 

最 后 ， 处 理 情况 (c)， 这 时 栈 项 是 空 栈 标记 符 $ 。 令 6(gloop 1es$) 二 {(giccept tE)? 0 

ob 11 给 出 了 PP 的 状态 图 。 a 

利用 在 引 理 2. 13 中 开发 的 过 程 ， 
A CFG G 转换 成 一 台 PDA Pi. 

S—aTblb 
T— Tale 

转移 函数 如 图 2-12 所 示 。 s 

下 面 证 明定 理 2.12 的 反方 向 。 对 于 正方 向 我 
们 给 出 一 个 把 CFG 转换 成 PDA 的 过 程 ， 主 要 思想 图 2-11 PP 的 状态 图 





e 4 一 w 对 于 规则 A 一 w 
aae “对 于 终结 符 a 








Al 2-12 Pi 的 状态 图 


是 设计 自动 机 ， 使 得 它 模拟 文法 。 现 在 要 给 出 一 个 以 相反 方式 进行 的 过 程 : 把 PDA 转换 
成 CFG， 设 计 模拟 自动 机 的 文法 。 这 项 工作 更 具 挑战 性 , “程序 设计 ”一 台 自 动机 比 “ 程 
序 设计 ”一 个 文法 容易 。 

如 果 一 个 语言 被 一 台 下 推 自动 机 识别 ， 则 它 是 上 下 文 无 关 的 。 

证 明 思 路 现 有 一 台 PDA P， 要 构造 一 个 CFG G, EFE P 接受 的 所 有 字符 串 。 换 
言 之 ， 如 果 一 个 字符 串 能 使 已 从 它 的 起 始 状态 转移 到 一 个 接受 状态 ， 则 G 应 该 产生 这 个 
FFE. 

为 了 获得 这 个 结果 ， 我 们 设计 一 个 能 做 更 多 事情 的 文法 。 对 于 P 的 每 一 对 状态 p 和 
gqg， 文 法 有 一 个 变 元 Am 。 它 产生 所 有 能 够 把 P 从 p 和 空 栈 一 块 带 到 gq 和 空 栈 的 字符 串 。 
可 以 看 出 不 管 栈 的 内 容 在 状态 P 时 是 什么 ， 这 样 的 字符 串 也 能 够 把 PP 从 p 带 到 gq， 并 且 保 
持 栈 的 内 容 在 状态 g MERS p 时 一 样 。 

首先 ， 为 了 简化 工作 ， 对 P 作 轻 微 修 改 ， 使 其 具有 以 下 三 个 特点 : 

1. 有 唯一 的 接受 状态 accept 。 

2. 在 接受 之 前 清空 栈 。 

3. 每 一 个 转移 把 一 个 符号 推 人 栈 〈 推 和 动作) ， 或 者 把 一 个 符号 弹出 栈 (弹出 动作 )， 
但 不 同时 做 这 两 个 动作 。 

使 PP 具有 特点 1 和 特点 2 较 容易 ， 使 P 具 有 特点 3 就 要 把 每 一 个 同时 弹出 和 推 入 的 转 
移 蔡 换 成 两 个 转移 ， 中 间 要 经 过 一 个 新 的 状态 ;把 每 一 个 既 不 弹出 也 不 推 人 的 转移 替换 成 
两 个 转移 ， 先 推 人 任意 一 个 栈 符号 ， 然 后 再 把 它 弹出 。 

要 设计 G, (HF Ap PEGE PP M p 带 到 g 并 且 以 空 栈 开始 和 结束 的 所 有 字符 串 ， 必 须 
了 解 书 对 这 样 的 字符 串 如 何 运行 。 对 于 任何 一 个 这 样 的 字符 串 xz， 因为 P 的 每 一 个 动作 或 
者 是 推 人 或 者 是 弹出 ， 但 是 对 空 栈 不 能 弹出 ， 所 以 尸 对 z 的 第 一 个 动作 一 定 是 推 人 人。 类似 
地 ， 因 为 在 结束 时 栈 是 空 的 ， 所 以 对 并 的 最 后 一 个 动作 一 定 是 弹出 。 

Æ P Xi x 的 计算 过 程 中 可 能 出 现 两 种 情况 : 仅 在 计算 的 开始 和 结束 时 ， 栈 可 能 是 空 
的 ; 或 者 除开 始 和 结束 时 之 外 ， 在 计算 中 的 某 个 地 方 ， 栈 变 成 空 的 。 如 果 是 前 一 种 情况 ， 
最 后 弹出 的 符号 一 定 就 是 开始 时 推 人 的 那个 符号 。 用 规则 Am 一 aA-2 模拟 前 一 种 情况 ， 
其 中 a 是 在 做 第 一 个 动作 时 读 到 的 输入 符号 ，2 是 在 做 最 后 一 个 动作 时 读 到 的 输入 符号 ，r 
EIRE p 后 面 的 状态 ，s Æq 的 前 一 个 状态 。 用 规则 Am 一 ArvrAznm 模 拟 后 一 种 情况 ， 其 中 > 
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是 栈 在 计算 中 间 变 成 空 的 时 候 的 状态 。 

证 明 设 忆 = 一 (Q, ET0 ao {daccept )， 要 构造 G。G 的 变 元 集 是 (Am 1p,gqEQ}， 起 
始 变 元 是 Ana o 下 面 三 点 描述 了 G 的 规则 ， 

1. 对 每 一 cna qor: sEQ uEr Ma.be€d., WR lp ase) BA Cru) H d(s,b,u) 
包含 (g,e)， 则 把 规则 App —>aAnsb WAG 中 。 

2. 对 每 一 个 pa rEQ, WAN AprApAngMAG F, 

3. 最 后 ， 对 每 一 个 pEQ， 把 规则 Aypp 一 e MAG 中 。 

可 以 从 图 2-13 和 图 2- 14 获得 一 些 关 于 这 个 构造 的 直觉 。 





由 4,, 产 生 由 4 产生 


图 2- 13 ”对 应 规则 A 一 ApAn 的 PDA 计算 





由 4,, 产 生 
图 2-14 对 应 规则 A,,>aA,b 的 PDA 计算 


下 面 证 明 Am 产生 z SAMS x 能 够 把 P 从 状态 p 和 空 栈 一 块 带 到 状态 gq 和 空 栈 ， 从 
bh 术 构 造 是 正确 的 。 把 当 且 仅 当 条 件 中 的 每 一 方向 作为 一 AREER, 

如 果 Ap Fear, Wi x bie PK p Fo FR—-RBS) g 和 空 栈 。 

通过 对 从 Am 到 z 的 派生 步 数 进行 归纳 来 证 明 这 个 断言 。 

归纳 基础 ”派生 只 有 一 步 。 

只 有 一 步 的 派生 一 定 使 用 一 条 右 端 不 含 变 元 的 规则 。 在 G 中 右 端 不 出 现 变 元 的 规则 只 
REE Ap >e WA, 输入 e 把 P Mp 和 空 栈 带 到 p 和 空 栈 ， 从 而 证 明了 归纳 基础 。 

归纳 步骤 假设 断言 对 长 度 不 超过 & 的 派生 成 立 ， 其 中 & 宇 1， 下 面 证 明 汤 言 对 长 度 为 
k 十 1 的 派生 也 成 立 。 

假设 Am 之 z 使 用 k 十 1 步 。 该 派生 的 第 一 步 是 Ap, aA nb MA pA pAwm， 分 别处 理 

对 于 第 一 种 情况 ,根据 x 中 由 A; 产生 的 部 分 y， 有 x 二 ayb， 因 为 As >y 使 用 & 步 ， 
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根据 归纳 假设 ，P 能 够 从 r 和 空 栈 一 块 转移 到 和 空 钱 。 因 为 A 一 aAn,b ÆG 的 一 条 规 
则 ， 故 对 某 个 栈 符 号 G，6(p,aye) BE (rou) Md(s,b,u) 包含 (qe). FH, MFP 
从 状态 p 和 空 栈 开 始 ， 那 么 在 读 到 a 后 ， 它 能 够 转移 到 状态 r, HEHE x 推 人 栈 顶 。 然 后 
读 >y， 把 它 带 到 *， 并 且 在 栈 中 留 下 x。 接 着 在 读 到 上 后 ， 它 能 够 转移 到 gg， 并 且 把 x 弹出 
o AIE, x 能 够 把 P MA p 和 空 栈 带 到 gq 和 空 栈 。 

对 于 第 二 种 情况 ， 根 据 z 中 由 Ar 和 An 分 别 产生 的 部 分 > 和 =， 有 z 一 yz。 因 为 Ar 之 y 
和 A= 之 > 都 不 超过 & 步 ， 根 据 归纳 假设 ，y 能 够 把 P Apar, z 能 够 把 P 从 r 带 到 gq， 
并 且 在 派生 的 开始 和 结束 时 都 是 空 栈 。 因 此 ，z 能 够 把 P 从 p 和 空 栈 带 到 gq 和 空 栈 。 这 就 
完成 了 归纳 步骤 。 

如 果 工 能 够 把 P 从 p 和 空 栈 带 到 g 和 空 栈 ， 则 Am 产生 工 。 

通过 对 输入 x，P 从 p 和 空 栈 到 gq 和 空 栈 的 计算 步 数 作 归 纳 ， 来 证 明 这 个 断言 。 

归纳 基础 ”计算 有 0 步 。 

如 果 计 算 有 0 步 ， 则 它 开 始 和 结束 在 同一 个 状态 ， 比 如 说 是 p。 因 此 ， 我 们 要 证 明 
Am 一 z。 在 0 步 内 ， 忆 无 法 读 入 任何 字符 ， 故 z=s。 根 据 G 的 构造 ， 它 有 规则 Ape, 
这 就 证 明了 归纳 基础 。 

归纳 步骤 假设 断言 对 长 度 不 超过 的 计算 成 立 ， 其 中 & 之 0， 要 证 明 断 言 对 长 度 为 
k 十 1 的 计算 也 成 立 。 

假设 已 有 一 个 计算 ， 在 & 十 1 步 内 xz 把 p 连同 空 栈 一 块 带 到 gq， 或 者 仅 在 计算 的 开始 
和 结束 时 栈 是 空 的 ， 或 者 在 其 他 某 个 地 方 栈 也 变 成 空 的 。 

对 于 第 一 种 情况 ， 第 一 步 推 人 栈 的 符号 一 定 和 最 后 一 步 弹 出 栈 的 符号 相同 ， 把 这 个 符 
FRN u, Wa 是 第 一 步 读 的 输入 符号 ，。b 是 最 后 一 步 读 的 输入 符号 ， r 是 第 一 步 后 的 状 
态 ，s 是 最 后 一 步 之 前 的 状态 ， 那 么 ，6(p,a,e) 包含 (rou) HC, bu) 包含 (q), M 
mÆ G 中 有 规则 Am 一 aA-2。 

令 y 是 z 中 不 包括 a 和 6 在 内 的 部 分 ， 即 x 二 ayb， 输 入 yy 能 够 把 P 从 r 带 到 s 而 不 触 
及 栈 底 的 符号 w， 从 而 PP 能够 在 输入 y 上 连同 空 栈 一 块 从 r 转移 到 s。 由 于 已 经 从 原来 关 
于 工 的 计算 中 删 去 第 一 步 和 最 后 一 步 ， 故 关于 y 的 计算 有 (k 十 1) 一 2==k 一 1 步 ， 于 是 ， 
根据 归纳 假设 有 As>y, MM, An’. 

对 于 第 二 种 情况 ， 设 ”是 关于 z 的 计算 中 除开 始 和 结束 之 外 栈 变 成 空 的 时 候 的 状态 ， 
Fe, HAM p 到 r 和 从 r Bq 的 部 分 都 不 超过 & 步 ， 记 yy 为 计算 前 一 部 分 读 的 输入 ，z 
为 后 一 部 分 读 的 输入 ， 根 据 归纳 假设 有 Ap 地 y MA,~>z. HFG 中 有 规则 A 一 ApAn， 
故 A>r, WE, 

这 就 完成 了 引 理 2. 15 和 定理 2. 12 的 证 明 。 = 

刚才 证 明了 下 推 自 动机 识别 上 下 文 无 关 语 言 类 ， 这 个 证 明 使 
我 们 能 够 给 出 正则 语言 和 上 下 文 无 关 语 言 的 关系 ， 如 图 2- 15。 因 
为 每 一 个 正则 语言 都 可 以 用 有 穷 自动 机 识别 ， 而 每 一 台 有 穷 自 动 
机 都 自动 地 是 一 台 下 推 自 动机 ， 所 以 只 要 不 考虑 它 的 栈 ， 每 一 个 
正则 语言 也 是 一 个 上 下 文 无 关 的 语言 。 图 2-15 正则 语言 与 上 下 

每 一 个 正则 语言 都 是 上 下 文 无 关 的 。 文 无 关 语 言 的 关系 
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2.3 非 上 下 文 无 关 语 言 


本 节 提 出 一 项 技术 ， 可 以 用 来 证 明 某 些 语 言 不 是 上 下 文 无 关 的 。 在 1.4 节 中 介绍 了 泵 
引 理 ， 用 来 证 明 某 些 语言 不 是 正则 的 ， 本 节 对 上 下 文 无 关 语 言 给 出 类 似 的 泵 引 理 ， 它 指出 
每 一 个 上 下 文 无 关 语 言 都 有 一 个 特殊 的 值 ， 称 为 泵 长 度 (pumping length)， 使 得 这 个 语言 
中 的 所 有 长 度 等 于 或 大 于 这 个 值 的 字符 串 都 能 够 被 “抽取 ”， 这 一 次 抽取 的 意思 要 复杂 一 
点 ， 它 是 指 字 符 串 能 被 划分 成 5 段 ， 其 中 第 2 段 和 第 4 段 可 以 同时 重复 任意 多 次 ， 并 且 所 
得 到 的 字符 串 仍 然 在 这 个 语言 中 。 


关于 上 下 文 无 关 语 言 的 泵 引 理 


(关于 上 下 文 无 关 语言 的 泵 引 理 ) ”如 果 A 是 上 下 文 无 关 语 言 ， 则 存在 数 
p CREE), RBA 中 任何 一 个 长 度 不 小 于 p 的 字符 串 s 都 能 被 划分 成 5 KM s=uvryz H 
满足 下 述 条 件 : 

1. 对 于 每 一 个 i>o, uviryiz EA; 

2. |vy|>>0; 

3. lory Sp. 

X s 被 划分 成 wuzyz 时 ， 条 件 2 保证 v 或 y 不 是 空 串 ， 否 则 定理 自动 成 立 ， 但 毫 无 意 
义 。 条 件 3 保证 v、xz My 三 段 在 一 起 的 长 度 不 超过 pp， 这 个 技术 性 条 件 在 证 明 某 些 语言 
不 是 上 下 文 无 关 语 言 时 有 用 。 

证 明 思 路 设 A 是 CFL,，G 是 产生 A 的 CFG。 要 证 明 A 中 任何 足够 长 的 字符 串 s 都 
能 够 被 抽取 ， 并 且 抽 取 后 的 字符 串 仍 在 A 中 。 

设 s 是 A 中 一 个 很 长 的 字符 串 (后 面 将 明确 给 出 “很 长 ”的 意思 )。 由 于 ss 在 A 中 ， 
它 可 以 用 G 派生 出 来 ， 从 而 有 一 棵 语法 分 析 树 。 由 于 s 很 长 ，s 的 语法 分 析 树 一 定 很 高 ， 
也 就 是 说 ， 这 棵 语法 分 析 树 一 定 有 一 条 很 长 的 从 树 根 的 起 始 变 元 到 树叶 上 的 终结 符 的 路 
径 。 根 据 饮 巢 原理 ， 在 这 条 长 路 径 上 一 定 有 某 个 变 元 R 重复 出 现 。 正 如 图 2- 16 所 示 ， 这 
种 重复 使 得 我 们 可 以 用 第 一 次 出 现 的 RR 下 面 的 子 树 代 替 第 二 次 出 现 的 R 下 面 的 子 树 ， 并 
且 仍 得 到 一 棵 合法 的 语法 分 析 树 。 由 此 ， 可 以 像 图 中 表示 的 那样 ， 把 * 切 成 5 段 uvryz, 
重复 第 2 段 和 第 4 段 ， 得 到 的 字符 串 仍 在 A 中。 换言之， 对 任意 的 ;之 0，xvizyizEA。 
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图 2-16 语法 分 析 树 上 的 外 科 手 术 


下 面 转 到 获得 条 引 理 中 全 部 3 个 条 件 的 细节 上 来 ,还 要 说 明 如 何 计算 泵 长 度 po 

证 明 设 G 是 关于 CFL A 的 一 个 CFG, 令 b 是 规则 右边 符号 数 的 最 大 值 〈( 假 设 大 于 
等 于 2)。 在 G 的 任 一 棵 语法 分 析 树 中 ， 一 个 结 点 最 多 有 8 个 儿子 ， 换 言 之 ， 离 起 始 变 元 1 
步 最 多 有 2 片 树叶 ; 离 起 始 变 元 不 超过 2 步 最 多 有 久 片 树叶 ; 离 起 始 变 元 不 超过 有 步 最 多 
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A b 片 树叶 。 因 此 ， 如 果 语 法 分 析 树 的 高 度 不 超过 hh， 则 它 产生 的 字符 串 的 长 度 不 超过 
Bb。 有 反之， 如 果 一 个 产生 的 字符 串 长 度 不 小 于 所 十 1， 则 生成 它 的 每 个 语法 树 高 度 至 少 为 
设 G 中 变 元 的 数目 为 | Y | 。 令 泵 长 度 p=b1T!， 则 AA 中 在 一 长 度 不 小 于 的 字符 
Ps 的 语法 分 析 树 的 高 度 不 小 于 |V| 十 1， 这 是 因为 61T! 之 biVI 十 1。 

为 说 明 如 何 抽取 s， 设 t+ 是 ;的 一 棵 语法 分 析 树 ， 如 果 s 有 若干 语法 分 析 树 ， 取 * 是 


结 点 数 最 少 的 语法 分 析 树 ， 由 于 的 高 度 不 小 于 |V | 十 1， 从 而 从 根 节 点 出 发 的 最 长 路 径 
的 长 度 不 小 于 |V| 十 1 并 包含 1V| 十 2 个 结 点 ， 其 中 一 个 结 点 为 终结 符 ， 其 他 为 变 元 。 因 


此 该 路 径 至 少 有 |V| 十 1 个 变 元 ， 因 为 只 有 树叶 是 终结 符 ， 故 这 条 最 长 的 路 径 上 至 少 有 
IV| 十 1 个 变 元 ， 而 G 只 有 |V | 个 变 元 ， 故 有 某 个 变 元 R 在 这 条 路 径 上 不 只 出 现 一 次 。 
为 了 后 面 的 方便 ， 选取 R 为 这 条 路 径 上 在 最 下 面 的 I|V| 十 1 个 变 元 中 重复 出 现 的 变 元 。 
按照 图 2- 16 把 s 划分 成 wvwzxyz。 在 每 一 个 尺 的 下 面 有 一 棵 子 树 ， 它 产生 * 的 一 部 分 。 上 
面 的 RR 有 一 棵 较 大 的 子 树 ， 产 生 wzy; 下 面 的 R 有 一 棵 较 小 的 子 树 ， 恰 好 产生 zx。 这 两 棵 树 
由 同一 个 变 元 产生 ， 因 而 可 以 相互 替换 ， 并 且 仍 得 到 一 棵 有 效 的 语法 分 析 树 。 对 于 每 一 个 
;全 1， 用 较 大 的 子 树 反复 替换 较 小 的 子 树 以 给 出 字符 串 wwzyiz 的 语法 分 析 树 ， 用 较 小 的 子 树 


蔡 换 较 大 的 子 树 以 产生 字符 串 wzz。 这 就 证 实 了 引 理 中 的 条 件 1， 下 面 转 到 条 件 2 和 条 件 3。 


正则 语 


为 了 得 到 条 件 2， 必 须 保证 v 或 y 不 都 是 se。 如 果 它 们 都 是 s， 则 用 较 小 的 子 树 替换 较 
产生 vey. 我 们 选取 尺 使 得 它 的 两 次 出 现 都 落 在 所 在 路 径 的 最 下 面 的 |Y| 十 1 个 变 元 中 ， 


大 的 子 树 得 到 的 语法 分 析 树 的 结 点 比 t 少 ， 并 且 仍 然 能 够 产生 s。 但 这 是 不 可 能 的 ， 因 为 
我 们 已 经 选取 tX s 的 结 点 数 最 少 的 语法 分 析 树 ， 这 也 是 为 什么 要 这 样 选取 r 的 原因 。 


为 了 得 到 条 件 3， 必 须 保 证 vey 的 长 度 不 超过 p， 在 ; 的 语法 分 析 树 中 ， 上 面 的 R 


IV| 十 1。 这 么 高 的 树 只 能 产生 长 度 不 超过 blvI+1 一 户 的 字符 串 。 
用 泵 引 理 证 明 语言 


而 这 条 路 径 又 选取 的 是 语法 分 析 树 中 的 最 长 路 径 ， 因 此 R 产生 vry 的 子 树 的 高 度 不 超过 
的 人 旭 引 理 证 明 非 正则 性 的 有 关 问 题 。 
不 十 上 下 文 无 大 的 。 


关于 用 泵 引 理 证 明 语 言 不 是 上 下 文 无 关 的 提示 ， 请 复习 例 1. 38， 在 那里 讨论 了 用 关于 
B= {a"b"c" |n=0} 


假设 B 是 CFL， 要 得 出 矛盾 的 结果 。 令 p 是 B 的 泵 长 度 ,， RERS, X pp 一定 
FE. ARFS ;二 a#*b?c? ， 显 然 ，s 属于 B 上 且 长 度 不 小 于 p。 泵 引 理 称 s 能够 被 抽取 ， 
但 是 我 们 证 明 这 是 不 可 能 的 ， 换 言 之 ， 我 们 证 明 不 管 怎么 把 s 划分 成 xzyz， 总 要 违反 泵 
引 理 中 的 一 个 条 件 。 

首先 ， 条 件 2 规定 v 或 者 y 不 是 空 串 ， 然 后 根据 子 串 v My 是 否 含 有 一 种 以 上 的 符 
号 ， 考虑 下 述 两 种 情况 : 
引 理 的 条 件 1, FA. 


l. 当 v 和 y 都 只 含有 一 种 符号 时 ，a 和 bb 或 b 和 cc 不 会 都 在 v 中， 同样 也 不 会 都 在 y 


中 ， 这 时 字符 串 uw?zxy*z 不 可 能 含有 个 数 相 同 的 a、b Alc, AK, ERT B， 这 违反 泵 
些 符号 的 次 序 不 可 能 正确 。 因 此 它 不 属于 B， FH. 


2. 当 v 或 者 y 含有 一 种 以 上 符号 时 ，uw*zxy*z 可 能 含有 个 数 相同 的 3 种 符号 ， 但 是 这 
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这 两 种 情况 必 有 一 个 发 生 ， 因 为 这 两 种 情况 都 产生 矛盾 ， 故 矛盾 是 不 可 避免 的 ， 因 
此 ， 假设 BE CFL 错误 ， 于 是 ， 得 证 BAR CFL. a 
GHB 4 c= {aipiv|0<i<j<k)}， 用 泵 引 理 证 明 C 不 是 CFL。 该 语言 很 像 例 
2. 20 中 的 语言 中 ， 但 证 明 它 不 是 上 下 文 无 关 语 言 要 复杂 一 些 。 
假设 C 是 CFL， 要 得 出 矛盾 。 令 p 是 有 泵 引 理 给 出 的 泵 长 度 ， 使 用 前 面 使 用 过 的 字符 
串 s 二 a?b?c? ， 但 是 这 次 必须 既 “ 抽 进 ” 又 “抽出 ”。 令 s 二 wvxyz， 并 且 再 次 考虑 例 2. 20 
中 出 现 的 两 种 情况 。 
1. v 和 yy 都 仅 含 一 种 符号 。 注 意 在 前 面 情况 1 中 使 用 的 理由 不 再 适用 ， 这 是 因为 C 的 
字符 串 中 a, b, 的 个 数 不 必 相等 ， 而 只 需 是 非 降 序 的 。 我 们 必须 更 仔细 地 分 析 这 种 情况 
才能 证 明 :不 可 能 被 抽取 。 注 意 到 由 于 v 和 yy 都 只 含 一 种 符号 ，a、b 和 c 中 有 一 种 不 出 现 
在 v 和 yy 中。 根据 哪 个 符号 不 出 现 ， 把 这 种 情况 进一步 分 成 3 种 子 情况 : 
a a 不 出 现 。 用 抽出 得 到 字符 串 uv cy ze=—urz, ERA a WAAS s 的 相同 ,但 是 b 
的 个 数 或 者 c 的 个 数 比 s 的 少 ， 因 此 ， 它 不 属于 C， 了 矛盾 。 

b. b 不 出 现 。 由 于 和 >y 不 都 是 空 串 ，a 或 c 必 出 现在 v 或 y 中。 如 果 a 出 现 ， 则 字 
IFE xvo2zyzz 中 a 比 b 多 ， 从 而 不 属于 C。 如 果 c 出 现 ， 则 字符 串 urey zH bte 
c 多 ， 从 而 也 不 属于 C。 不 管 是 哪 种 情况 ， 都 有 矛盾 。 

c. Cc 不 出 现 。 则 字符 串 xzyz 中 a 或 b 比 c 多 ， 从 而 不 属于 C， 了 矛盾 。 

2. vu 或 y 含有 一 种 以 上 符号 。xv2 acy? 中 的 符号 不 能 以 正确 的 方式 排列 ， 因 而 它 不 可 
能 属于 CC， 矛盾。 

于 是 ， 得 证 s 不 可 能 被 抽取 ， 违 反 泵 引 理 ， 从 而 C 不 是 上 下 文 无 关 的 。 £ 

UERJ 邻 D 一 (ww|wE€E1(0,1}* })， 用 泵 引 理 证 明 D AE CFL., hit D Æ CFL 并 
得 出 矛盾 的 结论 ， 令 p 是 泵 引 理 给 出 的 泵 长 度 ,) 

这 次 选取 字符 串 s 不 那么 明显 。 可 以 取 字 符 串 02101, CE D 的 成 员 且 长 度 大 于 上 p， 
因此 好 像 是 一 个 好 的 候选 对 象 ， 但 是 ， 按 如 下 划分 ;:， 它 就 能 够 被 抽取 ， 因 而 不 符合 我 们 
的 需要 。 





0?1 0?1 


一 人 
000***000 0 1 0 000+*-0001 


再 试 试 s 的 其 他 取 法 ， 字 符 串 012021 直观 上 看 比 前 一 个 字符 串 更 多 地 抓 住 了 语言 
D 的 “本 质 ?*， 事 实 上 ， 可 以 证 明确 实 如 此 ， 证 明 如 下 。 

要 证 明 字 符 串 * 王 02120212 不 能 够 被 抽取 ， 用 有 泵 引 理 中 的 条 件 3 限制 划分 的 方式 。 
条 件 3 称 ， 将 s Mat Ms=uvreyz, HP lvry|<p, s 能 被 抽取 。 

首先 ， 子 串 wzy 一 定 横 跨 HPA, AM, MR vry 位 于 s 的 前 一 半 ， 把 s 抽 成 
uv?’ ry? z 时，1 移 到 后 一 半 的 第 一 个 位 置 ， 因 此 uv’ xy’ x 不 可 能 是 ww 的 形式 。 类 似 地 ， 
如 果 vry 位 于 s 的 后 一 半 ， 把 * HR uvey 时 ，0 移 到 前 一 半 的 最 后 一 个 位 置 ， 因 此 
uv’ ry z 也 不 可 能 是 ww 的 形式 。 

但 是 ， 如 果子 串 vry 横 跨 s 的 中 点 ， 把 ;往外 抽 成 urz, CÉ olor, Hi My 不 
可 能 都 等 于 p。 这 个 字符 串 不 是 ww 的 形式 。 于 是 ，s 不 能 够 被 抽取 ， 从 而 品 不 是 CFL。 m 


2.4 ”确定 型 上 下 文 无 关 语 言 
回想 一 下 ， 确 定型 有 穷 自动 机 和 非 确 定型 有 穷 自 动机 具有 等 价 的 语言 识别 能 力 。 相 


反 ， 非 确定 型 下 推 自动 机 比 确定 型 下 推 自 动机 具有 更 强 的 能 力 。 我 们 将 看 到 ， 一 些 不 能 由 
确定 型 PDA 识别 的 上 下 文 无 关 语言 ， 需 要 用 非 确 定型 PDA 来 识别 。 能 被 确定 型 下 推 目 动 
机 (DPDA) 识别 的 语言 称 为 确定 型 上 下 文 无 关 语 言 (DCFL)。 它 是 上 下 文 无 关 语 言 的 一 
个 子 类 ， 并 与 许多 实际 应 用 相关 ， 例 如 : 程序 设计 语言 编译 器 中 语法 分 析 需 的 设计 ， 因 为 
通常 来 说 ， 与 CFL 相 比 ， 语 法 分 析 的 问题 对 DCFL 更 加 容易 。 本 节 将 简要 地 概述 这 一 重 
要 又 迷人 的 主题 。 

在 DPDA 的 定义 中 ， 我 们 遵循 了 确定 性 的 基本 准则 : 在 计算 的 每 一 步 ， 根 据 其 转移 函 
数 ，DPDA 最 多 只 有 一 种 继续 的 方式 。 定 义 DPDA 比 定义 DFA 更 复杂 ， 这 是 因为 DPDA 
可 能 在 不 弹出 一 个 栈 符号 的 情况 下 读 入 一 个 输入 符号 ， 反 之 亦 然 。 相 应 地 ，DPDA 的 转移 
函数 中 允许 = 转移 ， 尽 管 这 在 DFA 中 是 被 禁止 的 。e 转 移 有 两 种 形式 : = 输入 转移 (ein- 
put move) 对 应 于 8(a,s,z)，E 栈 转移 (estack move) 对 应 于 6(g,a,e)。 也 可 以 在 一 次 转 
移 中 把 这 两 种 形式 结合 起 来 ， 对 应 于 6(g,e,e)。 如 果 一 台 DPDA 能 够 在 某 种 情况 下 做 e 转 
移 ， 那 么 在 这 种 情况 下 涉及 处 理 非 e 符号 的 转移 是 被 禁止 的 ， 否 则 可 能 出 现 多 个 合法 的 计 
算 分 支 的 情况 ， 进 而 导致 非 确 定型 的 行为 。 形 式 化 定义 如 下 : 

确定 型 下 推 自 动机 (deterministic pushdown automaton) 是 一 个 6 元 组 
(QIT OF AFOST AFARA TAA FA 

1.Q 是 状态 集 ， 

2.5 是 输入 字母 表 ， 

3. 帮 是 栈 字母 表 ， 

4.6:QX>. XI. 一 (QXT.)U{GB) 是 转移 函数 ， 

D+ dg 人 EQ 是 起 始 状 态 ， 

6. FCQ 是 接受 状态 集 。 

转移 函数 6 必须 满足 如 下 人 条件 : 

A E-A gE Q acl Hore”, 

OC asa sti Algra) seet AP Hoye se) 
中 有 上 县 入 有 一 站 对 是 加 

转移 函数 可 能 输出 一 个 (r,y) 形式 的 单 次 转移 ， 或 输出 如 来 指示 不 做 任何 动作 。 举 
一 个 例子 来 说 明 这 些 可 能 性 。 假 设 转移 函数 为 8 的 一 个 DPDA M 位 于 状态 gq， 下 一 个 输入 
符号 是 a， 栈 顶 符 号 是 x。 如 果 6(g,a,7X) 二 (r,y)， 那 么 M 读 人 a， 从 栈 中 弹出 Tx， 进 入 状 
Ar, FAK y EAR. MM, 8l ar) =D, PASMUMFRACH, RERA a 并 
弹出 工 对 应 的 转移 。 这 种 情况 下 ，8 RRR Sela), lger), qese) 之 一 非 
空 ， 然 后 M 作 相 应 转移 。8 的 条 件 避 免 了 DPDA 在 同样 的 情况 下 执行 两 种 不 同 的 动作 
(例如 : Æ elar ADH 6(g,a,e) 关 名 就 会 发 生 这 种 情形 )， 从 而 确保 了 确定 型 行为 。 当 
栈 非 空 时 ，DPDA 在 任何 状况 下 都 只 有 一 个 合法 的 转移 。 寿 栈 为 空 ， 只 有 当 转 移 函 数 指明 
一 个 弹出 e 的 转移 时 ，DPDA 才能 转移 。 否 则 ，DPDA 没有 合法 的 转移 ， 拒 绝 ， 同 时 不 再 
读 取 剩余 的 输入 。 

DPDA 接受 的 方式 与 PDA 相同。 如 果 DPDA 在 读 入 输入 字符 串 的 最 后 一 个 符号 后 进 
入 接受 状态 ， 则 接受 这 个 字符 串 。 其 他 任何 情况 下 ， 则 拒绝 这 个 字符 串 。 两 种 情况 下 会 产 
生 拒绝 : 其 一 ，DPDA 读 入 了 全 部 输入 ， 但 最 后 没有 进入 接受 状态 ; 其 二 ，DPDA 没有 成 
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功 地 读 完 整个 输入 字符 串 。 当 DPDA 尝试 弹出 一 个 空 栈 ， 或 者 当 DPDA 在 某 个 位 置 后 不 
再 读 和 任何 输入 而 是 执行 无 尽 的 e 输 入 转移 序列 时 第 二 种 情况 就 可 能 出 现 。 

DPDA 的 语言 称 为 确定 型 上 下 文 无 关 语 言 (deterministic context-free language) 。 

QUAD 例 2.9 中 的 语言 (0”1”|n>0) 是 一 个 DCFL。 通 过 在 一 个 不 可 能 被 接受 的 
“ 死 ” 状 态 中 添加 缺失 状态 、 输 入 符号 和 栈 符号 组 合 的 转移 ， 可 以 容易 地 将 该 语言 的 PDA 
Mi 修改 为 一 台 DPDA。 

fil 2. 10 和 例 2.11 给 出 的 CFL{aibic|i,j,k 宇 0 H i=j Ni=k}) 和 (ww? |wEe 
{0,1}* } 都 不 是 DCFL。 问 题 2. 27 和 问题 2. 28 说 明了 非 确 定性 是 识别 这 些 语 言 的 必 
要 条 件 。 m 

有 关 DPDA 的 讨论 自然 地 倾向 于 技术 性 ， 尽 管 本 书 尽 最 大 努力 强调 其 实现 背后 的 主要 
思想 ， 但 本 节 内 容 的 难度 仍 大 于 前 面 章 节 。 本 节 内 容 并 不 影响 对 本 书后 续 内 容 的 理解 ， 因 
此 如 有 必要 可 以 跳 过 本 节 。 

接 下 来 ， 我 们 介绍 一 个 可 以 简化 后 续 讨 论 的 技术 性 引 理 。 前 文 介绍 过 ， 当 不 能 成 功 读 
人 全 部 输入 字符 串 时 ，DPDA 拒绝 输入 。 但 是 ， 这 类 DPDA 会 引入 一 些 杂 乱 的 情况 。 所 
幸 ， 下 面 的 引 理 表明 我 们 可 以 通过 转换 DPDA 来 避免 这 种 不 方便 的 情况 。 

任何 一 台 DPDA 都 有 一 台 能 够 读 完 整个 输入 字符 串 的 等 价 DPDA。 

证 明 思 路 ” 当 一 台 DPDA 试图 弹出 一 个 空 栈 或 者 执行 无 尽 的 = 输入 转移 序列 时 ， 它 可 
能 不 能 读 入 整个 输入 串 。 我 们 称 第 一 种 情况 为 hanging， 第 二 种 情况 为 looping。 用 一 个 特 
殊 符号 初始 化 栈 可 以 解决 hanging 问题 。 如 果 这 个 符号 在 输入 末端 之 前 被 弹出 栈 ， 那 么 
DPDA 读 完 剩 下 的 输入 并 拒绝 。 通 过 识别 looping 情况 发 生 《〈 即 不 再 有 输入 符号 被 读 和 人 )， 
并 重新 对 DPDA 编程 使 其 读 人 并 拒绝 输入 ， 可 以 解决 looping 问题 。 我 们 还 必须 调整 这 些 
修改 来 满足 在 输入 的 最 后 一 个 符号 发 生 hanging 或 者 looping 的 情况 。 如 果 DPDA 在 读 入 
最 后 一 个 符号 之 后 进入 接受 状态 ， 那 么 修改 后 的 DPDA 接受 而 不 是 拒绝 输入 。 

证 明 设 P=(Q,3,T,6,go,F) 是 一 台 DPDA。 首 先 ， 增加 一 个 新 的 起 始 状 态 dan 
一 个 额外 的 接受 状态 accept» TIRE qo， 以 及 其 他 新 状态 。 对 所 有 reQ, acd, 
以 及 zx，yET 实施 如 下 修改 。 

首先 ， 修 改 P 使 其 一 旦 进入 接受 状态 ， 就 停留 在 接受 状态 直至 读 入 下 一 个 输入 符号 。 
对 每 一 个 9g€ Q， 增 加 一 个 新 的 接受 状态 q, HHE ler) =r, y), WE OCG, .652)= 
(ra，;y)。 如 果 gE€EF， 则 修改 6 使 得 86(q,e,x) 二 (ra,y)。 对 每 一 个 gE€Q 和 a ET， 帮 6(gsa， 
Z) 一 (r,y)， 则 置 6(q ,a,ZX)= 二 (rr,y)。 设 下 是 新 、 旧 接受 状态 的 集合 。 

接 下 来 ， 通 过 用 一 个 新 的 特殊 栈 符 号 $ 初始 化 栈 来 修改 P， 使 其 在 尝试 弹出 空 栈 时 拒 
绝 。 如 果 己 随后 在 非 接受 状态 探测 到 $ ， 则 进入 gi 并且 扫 描 输 入 到 末端 。 如 果 P 在 接 
受 状态 探测 到 $ ， 则 进入 gq,..。.。 若 还 有 输入 处 于 未 读 状态 ，P 进入 q.,。 并 且 扫 描 输 入 到 
末端 。 ÉR, B Slane) =q $). MrceETAMd(q,a,xr4O, qF, WH 
elga» $)= (ia), FEF, WE Ca, $) = aop) WAL, B elgeta? 
E= (dreiect ds UAB r rt) = a a 

最 后 ， 修 改 忆 使 其 拒绝 ， 避 免 在 输入 末端 之 前 执行 无 尽 的 = 输入 转移 序列 。 对 每 一 个 
gq€EQ 和 xET， 当 PP 从 状态 g FRH cer ÆRMER, WR PP 不 再 弹出 xz 以 下 的 符号 也 
不 再 读 入 任何 输入 符号 ， 则 称 (q,x)〉 为 looping 状况 。 如 果 P 忆 在 随后 的 转移 中 进入 接受 状 
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AS, WW looping 状况 是 接受 的 ， 否则 是 拒绝 的 。 如 果 (g,zx) 是 接受 的 looping 状况 ， 置 
0699692) = (gq, on s€) ， a (qx) 是 拒绝 的 looping 状况 ， 置 8S(qye,Z) 一 (quectye) 0 = 
为 简便 起 见 ， 在 后 面 的 讨论 中 我 们 假设 DPDA 读 入 全 部 的 输入 。 


2.4.1 DCFL 的 性 质 

本 小 节 将 探究 DCFL 类 的 封闭 性 和 非 封 闭 性 ， 并 由 此 说 明 CFL 不 是 DCFL。 

DCFL 类 在 补 运算 下 封闭 。 

证 明 思 路 ”将 一 台 DFA 的 接受 状态 和 非 接受 状态 进行 交换 ， 得 到 一 台 识 别 语言 补 集 
的 新 DFA， 因 此 证 明正 则 语言 类 在 补 运算 下 封闭 。 同 样 的 方法 适用 于 DPDA, 但 有 一 个 
问题 。 在 输入 字符 串 的 末端 ，DPDA 进入 转移 序列 的 接受 和 非 接受 状态 都 可 能 接受 输入 。 
这 种 情况 下 ， 交 换 接 受 和 非 接 受 状态 仍然 会 接受 。 

通过 修改 DPDA 限制 接受 的 出 现 ， 可 以 解决 这 个 问题 。 对 输入 的 每 一 个 符号 ， 只 有 当 
修改 后 的 DPDA 将 要 读 入 下 一 个 符号 时 ， 该 DPDA 才能 够 进入 一 个 接受 状态 。 换 言 之 ， 
只 有 读 人 状态 (总 是 读 人 输入 符号 的 状态 ) 才 可 能 是 接受 状态 。 因 此 ， 只 有 在 这 些 读 人 状 
态 中 交换 接受 状态 和 非 接 受 状态 ， 才 能 转换 DPDA 的 输出 。 

证 明 首先 按照 引 理 2. 25 的 证 明 中 的 描述 修改 P， 令 机 器 (Qreq FO 为 修改 
结果 。 这 个 机 器 总 是 读 人 全 部 输入 字符 串 。 此 外 ， 一 旦 进入 一 个 接受 状态 ， 它 停留 在 接受 
状态 直到 它 读 入 下 一 个 输入 符号 。 

为 了 实现 证 明 思路 ， 我 们 需要 识别 读 入 状态 。 如 果 DPDA 在 状态 q 读 入 一 个 输入 符号 
a E53 而 没有 弹 栈 ( 即 ela AD), WANAE gq 为 一 个 读 入 状态 。 然 而 ， 如 果 DPDA iz 
入 a 并 且 弹 栈 ， 那 么 根据 弹出 的 符号 决定 读 入 操作 ， 因 此 将 这 一 步 一 分 为 二 : 弹出 和 接 下 
来 的 读 人 。 对 aE€5 和 xzETIT， 如 果 6(gq,a,7x)= 二 (r,y)， 那 么 增加 一 个 新 状态 g, 并 且 修 改 6 
使 得 6(g,e,X) 二 (gq,,e)，6(gq,,ase) 二 (r,y)。 认 定 9 为 一 个 读 人 和 人 状态。 状态 q, 从 不 弹 栈 ， 
所 以 它 的 动作 与 栈 内 容 无 关 。 如 果 gE€ FF， 认定 gq, 为 一 个 接受 状态 。 最 后 ， 从 所 有 非 读 入 
状态 中 移 除 接受 状态 的 认定 。 修 改 后 的 DPDA 等 价 于 P, 但 是 对 每 个 输入 符号 ， 当 DPDA 
将 要 读 入 下 一 个 符号 时 ， 它 最 多 进入 一 个 接受 状态 。 

现在 ， 对 认定 为 接受 的 读 人 状态 进行 转换 (为 非 接 受 )。 修 改 后 的 DPDA 识别 语言 
补 集 。 è 

此 定理 说 明 一 些 CFL 并 不 是 DCFL. Æ CFL 的 补 不 是 一 个 CFL， 那 么 该 CFL 也 不 是 
DCFL, Alb, A={aibict |i 关 j 或 j 关 &， 其 中 i,j,k 宇 0) 是 一 个 CFL 但 不 是 一 个 DCFL。 
否则 ，A 若是 一 个 CFL， 问 题 2. 30 的 结果 会 错误 地 认为 A[a*b*c* ={a"b"c"|n>0} 是 
上 下 文 无 关 的 。 

问题 2. 23 要 求证 明 在 其 他 常见 的 运算 如 并 、 交 、 星 和 逆 下 DCFL 类 是 不 封闭 的 。 

为 了 简化 讨论 ， 偶 尔 我 们 会 考虑 将 一 个 特定 的 标记 符号 十 添加 到 输入 字符 串 的 末尾 ， 
将 其 称 为 输入 结束 标记 (endmarked input). RAK- 添加 到 DPDA 的 输入 字母 表 。 在 下 
一 个 定理 中 可 以 看 到 ， 添 加 输入 结束 标记 不 会 改变 DPDA 的 能 力 。 然 而 ， 在 设计 DPDA 
时 考虑 输入 结束 标记 ， 可 以 获知 输入 字符 串 的 结束 信息 ， 从 而 简化 设计 难度 。 对 任意 语言 
A， 我 们 用 结束 标记 语言 A KARAS wd 的 集合 ， 其 中 wEA。 

A 是 DCFL 当 且 仅 当 AJ 是 DCFL。 
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证 明 思 路 ”证明 该 定理 的 充分 性 比较 容易 。 令 DPDA P WJA., DPDA PRAP Ë 
A P'RA ， 从 而 识别 Ad 。 此 时 ， 如 果 在 前 一 个 符号 中 PP 已 经 进入 接受 状态 ,那么 P 
接受 。P' 不 再 读 人 -| 之 后 的 任何 符号 。 

为 了 证 明定 理 的 必要 性 , 4 DPDA P Wal Ad 并 且 构 造 一 个 识别 A 的 DPDA P 。 因 
为 P' 读 人 其 输入 ， 因 此 它 模拟 已 。 在 读 和 每 一 个 输入 符号 之 前 ，P 判定 若 该 符号 为 4 P 
是 否 接受 。 若 是 ，P 进入 一 个 接受 状态 。 注 意 ，P 可 能 在 读 人 -| 之 后 进行 栈 操作 ， 因 此 读 
AJ 之 后 需要 根据 栈 的 内 容 来 判定 P 是 否 接受 。 当 然 ，P' 不 能 在 任 一 个 输入 符号 时 弹出 
整个 栈 ， 因 此 P' 必 须 在 不 弹出 栈 的 情况 下 判定 P HEAT 之 后 的 动作 。 替 代 方 案 是 P 在 
栈 中 存储 额外 的 信息 从 而 允许 P' 立 刻 判 定 P 是 否 接受 。 这 个 信息 表明 了 从 哪个 状态 开始 
P 最 终 会 接受 ， 同 时 (可 能 ) 进行 栈 操作 ， 但 不 再 读 入 任何 输入 。 

证 明 我 们 只 给 出 必要 性 证 明 的 细节 。 正 如 证 明 思 路 所 述 , 令 DPDA P=(Q,5U 
{4 r.g FP 识别 A- 并 且 构 造 一 台 DPDA P'==(Q 3,P ,8 ao FO 识别 A。 首 先 ， 
修改 P 使 得 它 的 每 次 转移 都 仅 执 行 下 述 操作 之 一 : 读 人 一 个 输入 符号 ; 将 一 个 符号 压 人 
Bes 从 栈 中 弹出 一 个 符号 。 通 过 引入 新 状态 很 容易 实现 这 些 修改 。 

P 模拟 已 ， 同 时 维持 一 个 栈 内 容 的 拷贝 并 交错 存储 栈 的 额外 信息 。 每 当 己 压 人 一 个 也 
的 栈 符号 ，P' 随 之 压 和 人 一 个 代表 PP 状态 子 集 的 符号 。 因 此 ， 置 卫 =PUP(CQ) 。 忆 的 栈 中 卫 
的 成 员 与 P(Q) 的 成 员 交 错 存储 。 如 果 REP(Q) ERMAS, 那么 从 R 的 任 一 状态 开始 
P, P 最终 会 接受 并 且 不 再 读 人 更 多 输入 。 

初始 ，P' 将 状态 集合 Ro EAR, Ro 包含 的 任 一 状态 g 满足 ， 当 PP 从 g 开始 并 且 栈 为 
Z, P 最 终 将 会 接受 并 且 不 再 读 入 任何 输入 符号 。 那 么 P' 开 始 模 拟 P。 为 了 模拟 一 个 弹出 
转移 ，P 首先 弹出 并 抛弃 栈 顶 符号 所 代表 的 状态 集合 ， 接 下 来 P' 再 次 弹 栈 从 而 得 到 PP 在 
当前 应 该 弹出 的 符号 ， 并 根据 该 符号 判定 P 的 下 一 次 转移 。 模 拟 一 个 压 人 转移 eqe) 
Cx), PEARS qa 到 状态 > 的 过 程 中 压 人 zz， 具 体操 作 如 下 。 首 先 ，P“ 检查 栈 顶 的 状态 
集合 尺 ， 然 后 己 压 入 z， 得 到 集合 S。S 满足 若 g EF 或 者 6(g,e,Xx)= 二 (r,e) HrER, Wg 
ES。 换 句 话 说 ， 状 态 集合 S 要 么 立即 接受 ， 要 么 在 弹出 z 后 会 进入 尺 中 的 一 个 状态 。 最 
后 ，P' 通 过 检查 栈 顶 集合 R 并 且 当 ER 时 进入 一 个 接受 状态 来 模拟 一 个 读 人 转移 8(q,a， 
se) 一 (r,e) 。 如 果 在 进入 这 个 状态 时 ，P 位 于 输入 字符 串 的 最 后 ， 那 么 已 会 接受 这 个 输入 。 
如 果 已 不 是 在 输入 字符 串 的 最 后 ， 那 么 它 将 继续 模拟 已 ， 那 么 这 个 接受 状态 也 必定 会 记录 
P 的 状态 。 因 此 ， 我 们 创建 这 个 状态 作为 P 原始 状态 的 第 二 个 拷贝 ， 将 它 标记 为 已 的 一 


个 接受 状态 。 加 


2.4.2 确定 型 上 下 文 无 关 文 法 


这 一 节 定 义 了 确定 型 上 下 文 无 关 文法 ， 它 对 应 于 确定 型 下 推 自动 机 。 我 们 将 说 明 若 把 
关注 限于 结束 标记 语言 (该 语言 中 所 有 字符 串 都 以 十 终止);， 则 这 两 个 模型 具有 等 价 的 能 
力 。 相 比 于 正则 表达 式 和 有 穷 自 动机 ,或 者 CFG 和 PDA， 这 些 生 成 模型 和 识别 模型 在 不 
需要 结束 标记 的 情况 下 就 能 准确 描述 同一 类 语言 ， 因 此 确定 型 上 下 文 无 关 文 法 和 确定 型 下 
推 自动 机 之 间 的 对 应 关系 并 不 强大 。 然 而 ， 对 于 DPDA 和 DCFG, 结束 标 记 是 必需 的 ， 否 
则 等 价 关 系 就 不 再 成 立 。 

在 确定 型 自动 机 中 ， 计 算 过 程 的 每 一 步 决定 了 下 一 步 。 自 动机 不 能 对 如 何 向 前 推进 做 
出 选择 ， 因 为 在 任何 节点 上 都 只 有 一 种 向 前 推进 的 可 能 性 。 为 了 用 文法 来 定义 确定 性 ， 观 


84 R—BY 自动 机 与 语言 


察 发 现 自动 机 中 的 计算 对 应 于 文法 中 的 派生 。 在 一 个 确定 型 文法 中 ， 如 下 文 所 述 ， 派 生 是 
被 约束 的 。 

CFG 中 的 派生 开始 于 起 始 变 元 ， 根 据 文法 规则 得 到 一 系列 和 蔡 换 并 按 “ 目 项 回 下 ”的 
方式 推进 ， 直 至 派生 得 到 一 个 终结 符 串 。 为 了 定义 DCFG， 我 们 采用 “ 自 底 向 上 ”的 方 
式 ， 开 始 于 一 个 终结 符 串 ， 并 反 向 派生 ， 通 过 一 系列 归 约 步骤 (reduce step) 直至 得 到 起 
始 变 元 。 每 个 归 约 步骤 是 一 个 反 向 替换 ， 规 则 右边 的 终结 符 串 和 变 元 被 其 左边 的 相应 变 元 
所 替换 。 被 替换 的 串 称 为 归 约 串 〈reducing string) 。 我 们 将 整个 反 向 派生 过 程 称 为 一 次 归 
#) (reduction). mE% CFG 则 由 具备 确定 性 质 的 归 约 来 定义 。 

更 为 形式 化 地 ， 如 果 u 和 w 分 别 是 变 元 串 和 终结 符 串 ， 用 wu Pv 表示 从 经 过 一 个 归 
约 步骤 得 到 v。 换 句 话 说 ，u Pv Sv >u 含义 相同 。 一 个 从 u 到 v 的 归 约 (reduction from 
u to v) 是 一 个 序列 


我 们 称 u 可 归 约 (reducible) Alv, WE uev., #8 v 之 u， 那 么 wv。 一 个 从 u 开始 的 
1% (reduction from u) 表示 一 个 从 开始 至 起 始 变 元 的 归 约 。 在 一 个 最 左 归 约 (left- 
most reduction) 中 ， 每 一 个 归 约 串 只 在 其 他 所 有 归 约 串 完全 在 其 左边 后 才 归 约 。 仔细 想 
一 下 ， 可 以 看 出 最 左 归 约 即 是 反 向 的 最 右派 生 。 

这 里 可 以 看 出 CFG 确定 性 所 包含 的 思想 。 对 以 S 为 起 始 变 元 的 CFG， 串 w ATHE 
A, w 的 最 左 归 约 为 : 

w=u], Hu: 上 FF>…HF>z 人 一 9 

首先 ， 规 定 每 一 个 u 决定 下 一 个 归 约 步骤 +1。 因 此 w 决定 了 整个 最 左 归 约 。 这 个 规定 
只 是 表明 文法 是 无 歧义 的 。 为 了 得 到 确定 性 ， 我 们 还 需 更 进一步 。 对 每 一 个 u;， 其 下 一 个 
归 约 步骤 必须 由 u: 的 前 级 唯 一 确定 ， 且 此 前 级 从头 开始 并 且 包 含 了 归 约 步骤 中 的 归 约 上 串 
h, WAM, u 的 最 左 归 约 步骤 并 不 依赖 于 xi 中 其 归 约 串 右边 的 符号 。 

引 人 和 人 术语 能 帮助 我 们 更 准确 地 描述 思路 。 令 也是 属于 CFG 语言 G 的 一 个 字符 串 ， 令 
ui 出 现在 w 的 最 左 归 约 中 。 在 归 约 步骤 w muim P, RAN Tor 被 反 癌 运用 。 这 意味 着 
可 以 记 作 wi 二 zhy， wit+1 二 xTy， 其 中 RIAA, r Æu 的 一 部 分 并 出 现在 h 左 侧 ，y 
E ui 的 一 部 分 并 出 现在 h 右 侧 。 如 图 2- 17 所 示 。 

ui = Zz1 zhi hiy1 yri rj Tyi yi = uit 


图 2-17 zhyPzrTy 的 扩展 图 示 


我 们 将 h ME RAZ Th PE ui 的 一 个 句柄 〈handle)。 换 句 话 说， 出 现在 
wEL(G) 最 左 归 约 中 的 串 u 的 一 个 句柄 是 w; 的 归 约 串 以 及 在 归 约 中 xi 的 归 约 规则 。 有 
些 情况 下 ， 当 不 需 关 注 归 约 规则 时 ， 句 柄 仅 指 代 归 约 串 。 称 在 工 (G) 中 某 字 符 串 的 最 左 归 
约 中 出 现 的 串 为 有 效 串 (valid string) 。 我 们 只 定义 有 效 串 的 句柄 。 

如 果 文 法 有 歧义 ， 一 个 有 效 串 可 能 有 多 个 句柄 。 无 歧义 的 文法 仅 由 一 个 语法 树 产 生字 
符 串 ， 因 此 ， 其 最 左 归 约 、 句 柄 都 是 唯一 的 。 在 这 种 情况 下 ， 称 为 有 效 串 的 唯一 句柄 。 

F ui 在 一 个 句柄 之 后 ， 观 察 u 的 一 部 分 y。 因 为 归 约 在 最 左边 ， 所 以 y 总 是 一 个 终 
结 符 组 成 的 串 。 否 则 ，y 应 包含 一 个 变 元 符号 ， 且 该 变 元 符号 仅 从 前 一 个 归 约 步骤 中 产 
Er 该 归 约 步骤 的 归 约 串 完全 位 于 4h 的 右边 。 但是， 最 左 归 约 应 该 已 经 在 更 早 的 步骤 中 归 
约 了 句柄 。 
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考虑 文法 Gi: 
R>S|T 
S—aSb| ab 
T—aTbb|abb 
它 的 语言 是 BUC, Ht B={a"b™|m>1}, C=(a"b?"|m>1}, Æx aaabbbE L(G) 
的 最 左 归 约 中 ， 我 们 将 每 一 步 的 句柄 标注 了 下 划 线 : 
aaabbb PaaSbb PaSb eS PR 
相似 地 ， 串 aaabbbbbb 的 一 个 最 左 归 约 为 . 
aaabbbbbb FaaTbbbb PyaTbbPT PR 
在 这 两 个 例子 中 ， 所 展现 的 最 左 归 约 恰巧 是 唯一 可 能 的 归 约 ; 但 是 在 其 他 可 能 出 现 多 个 归 
约 的 文法 中 ， 我 们 必须 使 用 一 个 最 左 归 约 来 定义 句柄 。 注 意 ，aaabbb 和 aaabbbbbb 的 句 
柄 是 不 同 的 ， 尽 管 这 两 个 串 最 初始 的 部 分 一 致 。 接 下 来 我 们 将 会 在 定义 DCFG 时 简要 地 讨 
waar., 
— PDA 通过 它 的 非 确 定性 来 识别 L(G1)， 从 而 猜测 它 的 输入 是 否 在 B 中 或 在 C 
F., A, ECH a 的 句柄 压 人 栈 中 后 ， 它 弹出 a 的 句柄 并 且 将 每 一 个 与 b 或 者 bb 分 别 
匹配 。 问 题 2. 25 要 求证 明 L(G1) 不 是 一 个 DCFL。 如 果 尝 试 令 一 台 DPDA 识别 这 种 语 
言 ， 会 发 现 机 占 不 能 预先 知道 输入 是 否 在 吾 中 或 在 C 中 ， 因 此 它 并 不 知道 如 何 将 a 的 句柄 
E b 的 句柄 匹配 。 将 这 个 文法 与 文法 Gs 比较 : 
R—>1S|2T 
S—aSb|ab 
T—aTbb|abb 
G 中 第 一 个 输入 符号 提供 了 这 个 信息 。 我 们 对 DCFG 的 定义 必须 包含 G 但 排除 Gil 。 m 
令 Gs 为 如 下 文法 ; 








S—T] 
TTT) le 
这 个 文法 阐明 了 几 个 要 点 。 第 一 ， 它 产生 一 个 结束 标记 语言 。 稍 后 我 们 在 证 明 DPDA 和 
DCFG 的 等 价 性 时 ， 会 着 重 关注 结束 标记 语言 。 第 二 ，e 句柄 可 能 出 现在 归 约 中 ， 就 像 在 
$ OO] 的 最 左 归 约 中 短 下 划 线 表示 的 那样 : 
OOF BTO O04 BTCT) O4 BTO4 >T- WTA DS m 
因为 句柄 决定 归 约 ， 所 以 在 定义 DCFG 的 过 程 中 句柄 扮演 着 重要 的 角色 。 一 旦 我 们 知 
道 一 个 串 的 句柄 ， 我 们 就 知道 了 下 一 个 归 约 步 又。 为 了 使 接 下 来 的 定义 有 意义 ， 牢 记 我 们 
的 目标 : 我 们 力图 定义 DCFG 使 得 它 可 以 与 DPDA 相对 应 。 我 们 通过 展示 如 何 将 DCFG 
转换 成 等 价 的 DPDA 来 建立 这 个 对 应 关系 ， 反 之 亦 然 。 为 了 使 这 个 转换 有 效 ，DPDA 需 
要 寻找 句柄 ， 从 而 寻找 到 归 约 。 但 是 找到 一 个 句柄 可 能 有 技巧 性 。 看 起 来 我 们 需要 知道 一 
个 串 的 下 一 个 归 约 步骤 从 而 识别 它 的 句柄 ， 但 是 DPDA 不 需要 预先 知道 归 约 。 我 们 通过 限 
制 在 DCFG 中 的 句柄 来 解决 这 个 问题 ， 从 而 使 得 DPDA 能 够 更 为 容易 地 找到 句柄 。 
为 了 更 好 地 说 明定 义 ， 考 虑 某 些 串 有 多 个 句柄 的 歧义 性 文法 。 选 择 一 个 特定 的 句柄 可 
能 需要 预先 知道 哪 棵 语法 树 派 生 了 这 个 串 ， 以 及 那些 对 于 DPDA 一 定 是 无 法 获得 的 信息 。 
我 们 发 现 DCFG 是 非 歧义 性 的 ， 因 此 句柄 是 独一无二 的 。 然 而 ， 只 有 独一无二 的 句柄 对 年 


X DCFG 来 说 是 不 够 的 ， 就 如 同文 法 G1 在 例 2.28 中 展示 的 那样 。 

为 什么 拥有 独一无二 的 句柄 不 能 说 明 我 们 有 一 个 DCFG? 检查 G 中 的 句柄 能 明显 地 
看 到 答案 。 如 果 wEB, MAAE ab; 然而 如 果 wEC， 则 句柄 是 abb。 虽 然 ww 决定 了 会 
出 现 哪 种 情况 ， 但 是 确定 句柄 为 ab 还 是 abb 还 需要 检查 所 有 的 w， 并 且 当 一 台 DPDA 需 
要 选择 句柄 的 时 候 ， 它 还 没有 读 完 整个 输入 。 

为 了 定义 对 应 于 DPDA 的 DCFG， 我 们 对 句柄 施加 一 个 更 为 严格 的 要 求 。 一 个 有 效 串 
的 初始 部 分 〈 从 头 开 始 并 包括 它 的 句柄 ) 必须 足以 决定 句柄 。 因 此 ， 如 果 我 们 在 从 左 到 右 
读 入 一 个 有 效 串 时 ， 只 要 读 入 句柄 就 可 以 知道 我 们 获得 了 它 。 为 识别 句柄 ， 我 们 不 需要 读 
入 该 句柄 之 外 的 东西 。 回 忆 一 下 一 个 有 效 串 的 未 读 部 分 只 包括 终 绪 符 ， 因 为 这 个 有 效 串 已 
经 通过 一 个 初始 终结 符 串 的 一 个 最 左 归 约 得 到 了 ， 而 未 读 的 部 分 还 没有 处 理 。 因 此 ， 在 每 
一 个 有 效 串 chy(yES*) 中 是 独一无二 的 句柄 时 ， 我 们 说 h 是 有 效 串 v= 二 xhy 的 一 个 强 
制 句 柄 (forced handle), 

确定 型 上 下 文 无 关 文 法 (deterministic context-free grammar) 是 能 够 让 
每 一 个 有 效 串 都 有 一 个 强制 句柄 的 上 下 文 无 关 文 法 。 

为 了 简洁 ， 我 们 假定 在 整个 关于 确定 型 上 下 文 无 关 文 法 的 部 分 中 ，CFG 的 起 始 变 元 
不 出 现在 任何 规则 的 右边 ， 在 文法 中 每 一 个 变 元 出 现在 该 文法 语言 的 某 个 串 的 一 个 归 约 
中 ， 即 文法 不 包含 无 用 的 变 元 。 

虽然 我 们 关于 DCFG 的 定义 在 数学 上 是 很 精确 的 ， 但 是 它 并 不 能 提供 任何 明确 的 方式 
去 判定 一 个 CFG 是 否 是 确定 性 的 。 下 一 步 我 们 将 会 给 出 一 个 准确 实现 这 个 目的 的 过 程 ， 
称 之 为 DK- 测 试 。 当 我 们 展示 如 何 将 DCFG 转换 成 DPDA 时 ， 我 们 也 将 使 用 DK- 测 试 的 
构造 方法 使 得 DPDA 可 以 发 现 句 柄 。 

DK- 测 试 依赖 于 一 个 简单 但 令 人 惊讶 的 事实 。 对 任意 CFG G 我 们 能 够 构造 一 个 可 以 
识别 句柄 的 关联 DFA DK 。 特 别 地 ， 如 果 满 足以 下 条 件 ，DK 接受 它 的 输入 z: 

1. z 是 某 个 有 效 串 v= 二 zy 的 前 级 ; 

2. z 以 的 一 个 句柄 作为 结束 。 

此 外 ，DK 的 每 一 个 接受 状态 表明 〈 一 组 ) 相关 联 的 归 约 规则 。 在 一 个 一 般 性 的 CFG H, 
根据 扩展 z 的 有 效 v， 可 能 会 运用 多 个 归 约 规则 。 但 是 在 一 个 DCFG 中 ， 如 我 们 看 到 的 那 
样 ， 每 一 个 接受 状态 对 应 于 一 个 确定 的 归 约 规则 。 

在 形式 化 提出 DK 并 列举 它 的 性 质 之 后 ， 我 们 会 描述 DK- 测 试 。 计 划 是 这 样 的 ， 在 一 个 
DCFG 中 ， 所 有 的 句柄 都 是 强制 的 。 因 此 如 果 zy 是 一 个 以 z 为 前 缀 并 且 以 zy 的 一 个 句柄 为 
结尾 的 有 效 串 ， 那 么 这 个 句柄 是 独一无二 的 ， 且 它 也 是 所 有 有 效 串 zy 的 句柄 。 基 于 这 些 性 
质 ， 每 一 个 DK 的 接受 状态 一 定 与 某 个 单一 句柄 相关 联 ， 因 此 与 某 个 实际 的 归 约 规则 相关 
联 。 此 外 ， 接 受 状态 必须 不 能 拥有 一 个 向 外 的 路 径 ， 该 路 径 在 读 人 3* 中 的 一 个 串 之 后 可 以 
得 到 一 个 接受 状态 。 否 则 ，xzy 的 句柄 不 会 是 独一无二 的 或 者 句柄 会 依赖 于 yo Æ DK- 测 试 
中 ， 我 们 构造 DK， 如 果 所 有 G 的 接受 状态 都 有 这 些 性 质 ， 则 推断 出 G 是 确定 性 的 。 

为 了 构造 DFA DK ， 我 们 将 会 构造 一 个 等 价 的 NFA 天， 通过 在 定理 1. 19 中 介绍 的 子 
集 构造 将 K 转换 成 DKS 。 为 了 理解 K， 首 先 考虑 一 个 能 完成 更 简单 任务 的 NFA J。 它 接 


O 名字 DK 是 对 “确定 性 K” (deterministic K) 的 简化 ， 同 时 DK 也 代表 最 早 提 出 这 个 思路 的 人 Donald Knuth, 
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受 每 一 个 以 任何 规则 的 右边 作为 结束 的 输入 串 。 构 造 J eR. J Se 
用 ， 也 能 猜测 从 何 处 开始 将 输入 与 规则 的 右边 相 匹 配 。 随 着 匹配 输入 ，J 通过 已 经 选 好 的 
规则 右边 来 追踪 它 的 进程 。 我 们 用 在 这 个 规则 的 对 应 位 置 放置 句点 的 方式 来 表示 这 个 进 
程 ， 称 其 为 加 点 规则 (dotted rule) ， 在 其 他 一 些 资料 中 也 称 作 项 (item)。 因 此 对 每 个 在 
右边 有 个 符号 的 规则 B 一 wiuz…us， 我 们 得 到 十 1 个 加 点 规则 : 

B—. uj uz***uk 


Bu). u2***up 


Bou, Uo ee, Up 


Bou U2 °**°Upe 


每 一 个 加 点 规则 都 对 应 于 J 的 一 个 状态 。 我 们 用 一 个 方 框 (Bou. vo ] 来 表示 状态 和 相关 联 
的 加 点 规则 Bou v。 接 受 状态 (Bou. | 对 应 于 完整 规则 (completed rule) ， 即 以 句点 作 
为 结束 。 对 每 一 个 规则 B->u， 我 们 为 B>. 4] 添加 一 个 单独 的 由 所 有 符号 的 自 循环 构 成 的 
起 始 状 态 以 及 一 个 e- 转 移 。 因 此 如 果 在 输入 的 最 后 成 功 完成 匹配 ， 那 么 J 接受 。 如 果 出 现 
一 个 错误 的 匹配 或 者 最 后 的 匹配 没有 正好 出 现在 输入 的 末尾 ， 那 么 J 的 这 个 计算 分 支 会 
拒绝 。 

NFA K 以 相似 但 更 为 简捷 的 操作 选择 匹配 规则 。 只 有 可 能 的 归 约 规则 才 会 被 允许 。 
如 同 J， 它 的 状态 对 应 于 所 有 的 加 点 规则 。 它 有 一 个 特殊 的 起 始 状 态 ， 该 状态 对 所 有 包含 
起 始 变 元 Si 的 规则 来 说 ， 都 有 到 [Si->.v] 的 e- 转 移 。 在 其 每 一 个 计算 分 支 中 ， 开 将 一 个 
可 能 的 归 约 规则 与 输入 的 某 个 子 串 相 匹配 。 如 果 规 则 的 右边 包含 变 元 ， 开 会 不 确定 性 地 转 
到 某 个 扩展 该 变 元 的 规则 。 引 理 2. 31 形式 化 地 展现 了 该 思路 。 我 们 首先 详细 地 描述 K. 

转换 过 程 在 两 种 情况 下 出 现 ， 移动 转移 (shift-move) 和 上 转移 。 对 每 一 个 终结 符 或 
者 变 元 a 会 出 现 移动 转移 ， 对 每 个 规则 B>uav 有 


B—>u. av}—> BE 一 xz 
对 所 有 规则 B>uCv 和 C->r 会 出 现 e HB, 

Bu. Co)—= (C>. 
接受 状态 是 所 有 对 应 于 一 个 完整 规则 的 (Bu. 」〗。 接 受 状态 没有 向 外 的 转换 并 且 写 成 两 个 
方 框 的 形式 。 

下 一 个 引 理 以 及 它 的 推论 证 明了 K 接受 所 有 以 串 = 的 某 个 有 效 扩展 的 句柄 作为 结束 的 
串 z。 因 为 K 是 非 确定 性 的 ， 所 以 我 们 说 它 “ 可 能 ”进入 一 个 状态 来 表示 K 进入 了 它 的 
非 确定 型 的 某 些 分 支 上 的 状态 。 

在 输入 xz 上 开 可 能 进入 状态 Tour) SARS HEBD", r= zu 
E Xuvy 是 一 个 句柄 为 uv、 归 约 规则 为 T>uv HARES. 

证 明 思路 ”K 通过 将 一 个 选 定 的 规则 的 右边 与 输入 的 一 部 分 进行 匹配 来 完成 操作 。 如 
果 完 全 匹配 ，K 接受 。 如 果 规 则 的 右边 包含 变 元 C， 则 可 能 出 现 两 种 情况 。 如 果 下 一 个 输 
入 符号 是 C， 那 么 继续 匹配 选 定 的 规则 。 如 果 C 已 经 被 扩展 了 ， 输 入 会 包含 由 C 派生 出 的 
符号 ， 所 以 K 非 确定 性 地 为 C 选择 一 个 替换 规则 ， 并 从 这 个 规则 右边 的 起 始 位 置 开 始 匹 
配 。 若 当前 选 定 规则 的 右边 已 经 完成 匹配 ， 则 K 接受 。 
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证 明 ”首先 我 们 证 明 充 分 性 。 假 定 在 w 上 的 K 进入 IT->xv jj。 从 天 的 起 始 状态 一 直 
到 [T>u.v ] 检 查 K 的 路 径 。 想 象 该 路 径 如 同 被 = 转移 间隔 的 移动 转移 的 执行 过 程 。 移 动 
转移 是 共享 相同 规则 的 状态 间 的 转移 ， 从 读 入 符号 向 右 移动 句点 的 位 置 。 在 第 i 次 执行 
时 ， 规 则 为 ;>wuiS;41v;， 此 处 Si+1 为 下 一 次 执行 中 要 扩展 的 变 元 。 倒 数 第 二 次 执行 的 规 
则 是 Si>uiTv1» 最 后 一 次 执行 的 规则 是 I -*He, 

输入 必须 与 uiwu2*…uiu 王 xu 是 等 效 的 ， 因 为 串 w Mu 是 从 输入 中 读 入 的 移动 转移 符 
E, S y =u, RIER cuvy 可 以 从 G 中 派生 出 来 ， 因 为 上 述 规则 给 出 的 派生 过 
程 就 如 同 图 2- 18 中 语法 树 所 展示 的 一 样 。 

为 了 得 到 一 个 有 效 串 ， 对 y 中 出 现 的 所 有 变 元 进行 完全 扩展 直到 每 一 个 变 元 派生 出 某 
个 终结 符 串 ， 将 其 称 为 结果 串 yo P zuvy 是 有 效 的 ， 因 为 它 出 现在 wEL(G) 的 一 个 最 左 
归 约 中 ， 即 通过 完全 扩展 zuvy 中 的 全 部 变 元 得 到 的 一 个 终结 符 串 。 

正如 图 2- 19 所 示 ，uv 是 归 约 中 的 句柄 ， 且 它 的 归 约 规则 是 Tuv, 


S, S, 
| IN 
S, Sz 
| IN 
S, S; 
T T 
x u y y' x u v y 
图 2-18 派生 zuvy 的 语法 树 K 2-19 派生 带 有 句柄 uv 的 有 效 串 zuvy 的 语法 树 


现在 我 们 证 明 引 理 的 必要 性 。 假 定 串 xuvy 是 一 个 带 有 句柄 uv BAR A Tus 
HARR. WEH K 在 输入 cu 上 可 能 进入 状态 (Tou. v], 

xuvy 的 语法 树 出 现在 上 面 的 图 中 。 该 语法 树 以 起 始 变 元 Si 为 根 节点 ， 且 一 定 包 含 变 
TT, AW T>uv 是 zxvy 归 约 过 程 的 第 一 步 。 令 S;，…，Si 为 如 图 所 示 的 从 Si ATH 
路 径 上 的 变 元 。 注 意 ， 在 语法 树 上 出 现在 该 路 径 左 侧 的 所 有 变 元 都 是 未 扩展 的 ， 否 则 uv 
不 会 是 句柄 。 

在 这 棵 语法 树 上 ， 根 据 规则 S; 一 uiSi+1v;， 每 一 个 S; 推导 出 S;+1。 因 此 对 串 u Mo; 
来 说 ， 文 法 一 定 包含 下 面 的 规则 。 

Sı —> Ul S2 v 


S 一 > u2 S3 U2 


9 一 > uj lv, 


T— uv 
在 读 人 输入 z=xu 时 ，K 包含 下 述 从 它 的 起 始 状态 到 状态 Tou v) hk. HA, 
K 执行 一 个 e- 转 移 到 [S1 一 . uS), F, KRA wu 的 符号 ，K 执行 对 应 的 移动 转移 
直到 其 在 ui 的 结尾 进入 [Si 一 xw. Sm), EFE K 执行 一 个 -转移 到 (Sz 一 . uz S3vz ]， 在 读 
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A uz 后 执行 移动 转移 直到 其 达到 [Sz>uz. Ssvz]， 以 此 类 推 。 在 读 入 w 2K 进入 
(Siu. Toi), 通过 一 个 。 转 移 到 (了 >. wo]， 并 最 终 在 读 和 信之 后 进入 [T>wv)。 u 

下 面 的 推论 说 明了 K 接受 所 有 以 某 个 有 效 扩展 得 到 的 一 个 句柄 为 结尾 的 串 。 当 u=h， 
v=e 时 ， 可 由 引 理 2. 31 得 到 该 推论 。 名 


在 输入 zx 上 可 能 进入 接受 状态 当 且 仅 当 xz 二 zh Lh At 
归 约 规则 TT 一 h HARB chy 的 一 个 句柄。 

最 后 ， 我 们 通过 使 用 定理 1. 19 证 明 中 构造 的 子 集 ， 并 删除 所 有 从 起 始 状态 无 法 达到 
的 状态 ， 将 NFA K 转换 成 DFA DK. 每 一 个 DK 的 状态 包含 一 个 或 多 个 加 点 规则 。 每 一 
个 接受 状态 包含 至 少 一 个 完整 规则 。 通 过 指 代 包含 加 点 规则 的 状态 ， 可 以 将 引 理 2. 31 和 
推论 2.32 应 用 于 DK. 

现在 我 们 做 好 了 描述 DK- 测 试 的 准备 。 

从 一 个 CFG G 开始 ， 构 造 关 联 的 DFA DK。 通 过 检查 DK 的 接受 状态 ， 判 定 G 是 否 
是 确定 性 的 。DK- 测 试 保证 每 一 个 接受 状态 包含 : 

1. 有 且 仅 有 一 个 完整 的 规则 ， 

2. 在 所 有 加 点 规则 中 句点 不 会 紧 跟 一 个 终结 符 ， 即 对 a€E53， 没 有 形 如 B 一 u. av 的 加 
点 规则 。 

G 通过 DK- 测 试 当 且 仅 当 G 是 一 个 DCFG。 

证 明 思 路 ”我 们 会 展示 DK- 测 试 通过 当 且 仅 当 所 有 的 句柄 是 强制 的 。 等 价 地 ， 测 试 失 
败 当 且 仅 当 某 个 句柄 不 是 强制 的 。 首 先 ， 假 定 某 个 有 效 串 有 一 个 非 强制 的 句柄 。 如 果 我 们 
在 这 个 串 上 运行 DK, HEI 2.32 说 明 DK 在 句柄 的 结尾 进入 一 个 接受 状态 。 因 为 接受 状 
态 有 另 一 个 完整 的 规则 或 者 有 一 个 以 终结 符 开 始 到 达 接 受 状 态 的 向 外 路 径 ， 所 以 DK- 测 试 
是 失败 的 。 在 后 一 种 情况 中 ， 接 受 状态 会 包含 一 个 加 点 规则 ， 在 该 规则 中 一 个 终结 符 出 现 
在 句点 之 后 。 

反 过 来 ， 如 果 DK- 测 试 失败 是 因为 一 个 接受 状态 有 两 个 完整 的 规则 ， 在 这 种 情况 下 相 
关联 的 串 被 扩展 成 带 有 不 同 句柄 的 两 个 有 效 串 。 相 似 地 ， 如 果 接 受 状态 有 一 个 完整 的 规则 
和 一 个 加 点 规则 ， 在 这 个 加 点 规则 中 ， 和 终结 符 在 句点 之 后 ， 那 么 应 用 引 理 2. 31 能 得 到 带 
有 不 同 句 本 的 两 个 有 效 的 扩展 。 构 造 对 应 于 第 二 个 规则 的 有 效 扩 展 有 些 棘 手 。 

证 明 首先 来 看 充分 性 。 假 定 G 不 是 确定 性 的 ， 证明 G 不 能 通过 DK- 测 试 。 使 用 有 
一 个 非 强制 句柄 h 的 有 效 串 zhy 。 因 此 某 个 有 效 串 chy 有 一 个 不 同 的 句柄 有 了 关 h， 这 里 y 
是 一 个 终结 符 串 。 我 们 可 以 将 chy 写成 zhy 二 zxhy。 

如 果 zh 二 xh， 那 么 归 约 规则 是 不 同 的 ， 因 为 h 和 有 h 是 不 相同 的 句柄 。 因 此 ， 输 入 ch 
将 DK 传送 给 包含 两 个 完整 规则 的 某 个 状态 ,违背 了 DK- 测试 。 

如 果 zh 天 zi， 其 中 一 个 扩展 另 一 个 。 假 定 ch 是 xh MAAR. WR rh 是 更 短 的 串 ， 
用 y 代替 y ， 该 论证 和 串 的 互 换 相同 。 令 g 为 DK 在 输入 ch 上 进入 的 状态 。 状 态 q 一 定 
是 接受 的 ， 因 为 h 是 xhy 的 一 个 句柄 。 必 有 一 个 从 g 出 发 的 转移 箭头 ， 因 为 rh 通过 g 将 
DK 传送 给 一 个 接受 状态 。 另 外 ， 因 为 yE3+ ， 这 个 转移 箭头 被 一 个 终结 符 所 标注 。 这 
里 ye 是 因为 zh HET rh. AE g 包含 一 个 加 点 规则 ， 在 这 个 规则 中 一 个 终结 符 紧 跟 
在 句点 之 后 ， 这 违背 了 DK- 测试 。 

为 了 证 明 必要 性 ， 假定 G 在 某 个 接受 状态 g 不 能 通过 DK- 测试 ， 通过 展示 一 个 非 强 制 
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的 句柄 来 说 明 G 不 是 确定 性 的 。 因 为 g 是 接受 的 ， 它 有 一 个 完整 的 规则 T>h. 。 令 z 是 一 
个 可 以 将 DK 推导 至 9 R, WARN y€E53* ， 有 zx 二 Xxh， 这 里 有 效 串 rhy 有 带 归 约 规则 
Th 的 句 顶 hh。 现 在 根据 DK- 测 试 失败 的 方式 ， 考 虑 两 种 情况 。 
首先 ， 认 为 g 有 另 一 个 完整 的 规则 Boh... PBARTARCB chy 必定 有 一 个 带 有 归 约 
规则 Bh 的 不 同 句 柄 hh。 因 此 ，h 不 是 一 个 强制 句柄 。 | 
其 次 ， 认 为 g 包含 一 个 规则 B 一 u.av， 这 里 aE 3。 因 为 ch 将 DK 传送 给 gqg， 得 到 
Xh 二 Tu， 这 里 对 yY€E53* ，xuavy 是 有 效 的 ， 且 有 一 个 带 有 归 约 规则 B 一 uav 的 句柄 uav, 
为 了 说 明 h 是 非 强制 的 ， 完 全 扩展 v 中 所 有 变 元 得 到 结果 wv CS*, RAS y Savy, X 
意 y E353* 。 下 面 的 最 左 归 约 说 明了 chy 是 一 个 有 效 串 而 h 不 是 句柄 。 
xzhy =xhav y =xuav y Druavy PrBy DS 
这 里 S 是 起 始 变 元 。 我 们 知道 zuavy 是 有 效 的 并 且 通 过 使 用 一 个 最 右派 生 能 够 得 到 
zuav y, PRU xuav'y 也 是 有 效 的 。 此 外 ，zauav'y 的 句柄 要 么 位 于 v 中 (如 果 vA) 要 
么 就 是 uav (如果 v= 二 v )。 任 一 情况 下 ， 句 柄 包括 a 或 者 在 a 之 后 ， 而 不 能 是 hh， 因 为 h 
全 部 在 a 之 前 。 因 此 产 不 是 一 个 强制 句柄 。 a 
当 在 实际 中 建立 DFA DK 时 ， 直 接 构造 会 比 事先 构造 NFA K 更 快 。 首 先 在 包含 起 始 
变 元 的 所 有 规则 的 初始 位 置 加 点 ， 并 且 把 这 些 新 加 点 规则 放 入 DK 的 起 始 状态 。 如 果 在 任 
一 规则 中 某 个 句点 出 现在 变 元 C 之 前 ， 将 句点 置 于 所 有 在 左边 有 的 规则 的 初始 位 置 ， 并 
在 状态 中 添加 这 些 规 则 ， 继 续 这 个 过 程 直 到 不 能 得 到 新 的 加 点 规则 。 对 出 现在 句点 之 后 的 任 
一 符号 c， 添 加 一 条 标记 为 c 的 边 指 回 一 个 新 状态 ， 该 状态 包含 对 所 有 c 之 前 的 加 点 规则 ， 移 
动 句点 在 c 中 位 置 得 到 的 加 点 规则 ， 并 且 添 加 规则 来 对 应 句点 出 现在 变 元 之 前 时 的 规则 。 
这 里 我 们 说 明 DK- 测 试 对 下 面 的 文法 是 如 何 失败 的 〈 见 图 2- 20)。 
S>E- 
E-E+T | T 
T—TXa la 





Al 2-20 一 个 失败 的 DK- 测 试 例子 


注意 左下 侧 和 右上 侧 第 二 个 这 两 个 有 问题 的 状态 。 这 两 个 状态 中 都 有 一 个 接受 状态 包 
含 一 条 加 点 规则 ， 并 且 在 加 点 规则 中 一 个 终结 符 出 现在 句点 之 后 。 = 
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一 个 说 明 下 面 文法 是 DCFG W DFA DK ( 见 图 2-21). 


S>T- 
T—T(T) le 
观察 发 现 所 有 的 接受 状态 都 满足 DK- 测 试 的 条 
件 。 m 


2.4.3 DPDA 和 DCFG 的 关系 


T=T(,T) 
T—>.7(T) 
本 小 节 中 我 们 将 会 证 明 DPDA 和 DCFG 描述 相 Ira. 





同 的 结束 标记 语言 类 。 首 先 ， 我 们 将 说 明 如 何 将 
DCFG 转换 成 等 价 的 DPDA。 这 个 转换 在 所 有 情况 下 图 2-21 一 个 通过 PK 测试 的 例子 
都 能 进行 。 接 着 ,我们 将 说 明 如 何 实现 从 DPDA 到 等 价 的 DCFG 的 反 向 转换 。 该 转换 只 
在 结束 标记 语言 中 才能 进行 。 我 们 将 等 价 性 限定 于 结束 标记 语言 ， 否 则 模型 不 等 价 。 我 们 
已 经 证 明了 结束 标记 不 会 影响 DPDA 可 以 识别 的 语言 类 ,但 是 它们 会 影响 DCFG 产生 的 
语言 类 。 没 有 结束 标记 ，DCFG 只 产生 DCFL 的 一 个 子 类 一 一 它们 都 是 前 缀 无 关 的 〈 见 问 
题 2.22)。 注 意 所 有 的 结束 标记 语言 都 是 前 缀 无 关 的 。 

peeve 一 个 结束 标记 语言 由 一 个 确定 型 上 下 文 无 关 文 法 产生 ， 当 且 仅 当 它 是 确 
定型 上 下 文 无 关 的 。 

我 们 需要 证 明 充 分 性 和 必要 性 。 首 先 我 们 会 说 明 每 一 个 DCFG 有 一 个 等 价 的 DPDA。 
接 下 来 我 们 会 说 明 每 一 个 能 识别 结束 标记 语言 的 DPDA 都 有 一 个 等 价 的 DCFG。 我 们 用 不 
同 的 引 理 来 证 明 充 分 性 和 必要 性 。 

每 一 个 DCFG 都 有 一 个 等 价 的 DPDA。 

证 明 思 路 ”我 们 说明 如 何 将 DCFG G 转换 成 一 个 等 价 的 DPDA P. P 按 如 下 所 述 使 用 
DFA DK 进行 操作 。 对 于 从 输入 中 所 读 取 的 符号 ， 它 模拟 DK 直至 DK 接受 。 如 定理 
2.33 的 证 明 所 述 ，DK 的 接受 状态 指明 一 个 特定 的 加 点 规则 ， 因 为 G 是 确定 型 的 ， 并 且 这 
个 规则 为 扩展 了 目前 已 知 输入 的 有 效 串 确定 一 个 句柄 。 此 外 ， 因 为 G 是 确定 型 的 ， 这 个 句 
柄 适用 于 每 一 个 有 效 扩展 ， 特 别 地 ， 如 果 输 入 属于 工 (G)， 那 么 这 个 句柄 适用 于 对 P 的 全 
部 输入 。 所 以 P 能 使 用 这 个 句柄 为 它 的 输入 串 确定 第 一 个 归 约 步 邓 ， 尽 管 在 此 时 它 只 是 读 
入 了 它 输入 的 一 部 分 。 

P 如何 确 定 第 二 个 和 接 下 来 的 归 约 步骤 ? 一 个 思路 是 在 输入 串 上 直接 执行 归 约 步骤 ， 
然后 通过 DK 运行 修改 后 的 输入 ， 就 如 同 我 们 之 前 做 的 那样 。 但 是 输入 不 能 修改 或 者 重新 
读 入 ， 因 此 这 个 思路 行 不 通 。 另 一 个 思路 是 将 输入 拷贝 到 栈 并 在 栈 上 执行 归 约 步骤 ， 但 是 
这 样 的 话 已 必须 弹出 整个 栈 来 通过 DK 运行 修改 后 的 输入 ， 因 此 修改 后 的 输入 对 后 面 的 步 
又 就 不 能 持续 有 效 了 。 

这 里 有 一 个 小 技巧 ， 就 是 在 栈 里 存储 所 有 的 DK 的 状态 ， 而 不 是 存储 输入 串 。 每 当 忆 
读 入 一 个 输入 符号 并 模拟 一 个 在 DK 中 的 转移 时 ， 它 通过 将 其 压 人 栈 来 记录 DK 的 状态 。 
当 其 使 用 归 约 规则 Tu 来 执行 一 个 归 约 步骤 时 ， 它 从 栈 中 弹出 |x| 个 状态 ， 展 现在 读 入 zx 
之 前 DK 的 状态 。 它 将 DK 重 置 为 该 状态 ， 接 下 来 在 输入 荆 上 模拟 DK ， 并 将 产生 的 状态 
压 人 栈 。 之 后 P 像 之 前 读 取 和 处 理 输入 符号 那样 继续 进行 。 

当 P 将 起 始 变 元 压 人 栈 时 ， 它 已 经 找到 一 个 输入 到 起 始 变 元 的 归 约 ， 所 以 它 进入 一 个 
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接受 状态 。 a 

接 下 来 我 们 证 明定 理 2. 36 的 必要 性 。 

每 一 个 能 识别 结束 标记 语言 的 DPDA 都 有 一 个 等 价 的 DCFG。 

证 明 思 路 ”这 个 证 明 是 对 引 理 2. 15 中 将 PDA P 转换 为 等 价 CFG G 的 构造 过 程 的 修 
改 。 这 里 PP 和 G 是 确定 型 的 ， 在 引 理 2. 15 的 证 明 思 路 中 ， 我 们 改变 来 清空 它 的 栈 ， 
并 且 当 PP 接受 时 进入 一 个 指定 的 接受 状态 decep ~A PDA 不 能 直接 判定 其 在 输入 末尾 
是 什么 ， 所 以 PP 使 用 它 的 非 确定 性 来 猜测 其 会 处 于 哪 种 情况 。 我 们 不 希望 在 构造 DPDA 
P 的 过 程 中 引入 非 确定 性 。 和 替代 策略 是 使 用 一 个 假设 ， 假 设 志 CP) 是 结束 标记 的 。 我 们 
修改 也 来 清空 它 的 栈 ， 并 且 在 它 已 经 读 和 结束 标记 :| 之 后 进入 原 接 受 状 态 之 一 时 进 
as 

接 下 来 我 们 应 用 文法 构造 得 到 G。 简 单 地 应 用 原始 构造 于 DPDA 可 以 产生 一 个 近乎 确 
定型 文法 ， 这 是 因为 CFG 的 派生 密切 对 应 于 DPDA 的 计算 过 程 。 该 文法 在 次 要 的 、 可 修 
复 的 方式 下 不 是 确定 型 。 

原始 构造 引入 了 形 如 Am 一 AmwAzn 的 规则 ， 它 们 可 能 会 引起 卜 义 。 这 些 规 则 包括 的 情 
ÉS: Ap PETS, BPK P 从 状态 p 带 到 状态 g， 在 每 个 状态 的 结尾 栈 都 被 清空 ， 
以 及 在 中 途 栈 被 清空 。 替 换 操 作对 应 于 在 一 处 将 计算 分 拆 。 但 是 如 果 栈 多 次 清空 ， 那 么 会 
出 现 多 个 分 拆 。 每 个 分 拆 会 产生 不 同 的 语法 树 ， 所 以 产生 的 文法 是 歧义 性 的 。 通 过 修改 文 
法 使 得 计算 分 拆 只 在 栈 清 空 的 最 后 位 置 发 生 ， 可 以 消除 歧义 。 用 一 个 出 现在 歧义 性 文法 中 
的 简单 但 类 似 的 情况 来 说 明 : 

S>T- 
T>TT|(T) |e 
该 文法 等 价 于 非 歧 义 性 的 、 确 定型 的 文法 
S>T- 
T—T(T)|e 

接 下 来 我 们 通过 使 用 DK- 测 试 来 说 明 修 改 后 的 文法 是 确定 型 的 。 文 法 被 设计 成 模拟 
DPDA。 就 像 引 理 2. 15 的 证 明 一 样 ， 在 P 从 一 个 空 栈 上 的 状态 p 运行 到 一 个 空 栈 上 的 状 
态 g 的 过 程 中 Ay 产 生 这 些 串 。 我 们 将 会 使 用 PP 的 确定 性 来 证 明 G 的 确定 性 ， 这 样 我 们 会 
发 现 P 的 确定 性 对 于 定义 P 在 有 效 串 上 的 计算 过 程 从 而 来 观测 它 在 句柄 上 的 行为 是 很 有 
用 的 。 然 后 我 们 可 以 使 用 P 的 确定 型 行为 来 说 明 句 柄 都 是 强制 的 。 

证 明 认为 P 二 (Q,3,T,6,qo，(qsccept}) 并 构造 C。 起 始 变 元 是 Ao ,a 。 构 造 过 程 包 
uF 3 不 部 分 。 

1. 对 每 一 个 p,qg,r,sSEQ,uET， 以 及 a,bE3。， WMH Spas) 包含 (ru) 且 6(s,b， 
u) 包 含 (g,;e)， 那 么 将 规则 Am 一 aA-p MAG. 

2. 对 每 一 个 p,q,rEQ， 将 规则 Ap 一 ApyAn 放 入 G。 

3. 对 每 一 个 pEQ， 将 规则 App 一 e MAG. 

为 避免 引入 歧义 我 们 对 构造 过 程 作 修改 : 将 类 型 1 和 类 型 2 规则 合并 成 一 个 实现 相同 
效果 的 单一 类 型 1-2 规则 。 

1-2. 对 每 一 个 pigro tEQ uEr, URa, bE. WME lras) =(s u) H 8lt,b, 
uy=(qre), ARM A 一 ApyaAyb MAG. 
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为 了 看 到 修改 后 的 文法 产生 相同 的 语言 ， 考 虑 原始 文法 的 任 一 派生 。 对 每 一 个 由 类 型 2 
规则 Am 一 ApAw 导致 的 蔡 换 ， 我 们 可 以 假定 7 是 PP 在 栈 变 为 空 的 过 程 中 修改 断言 2. 17 的 
证 明 过 程 来 选择 r) 最 右 位 置 时 的 状态 。 那 么 Awy 随 后 的 替换 一 定 是 用 类 型 1 规则 A, 一 aAsb 
来 扩展 它 的 。 我 们 可 以 将 这 两 个 蔡 换 合并 成 一 个 单一 类 型 1-2 规则 Am 一 ApaAyb。 

相反 ， 在 一 个 使 用 修改 后 文法 的 派生 中 ， 如 果 用 类 型 2 规则 Ay 一 ApAr 和 紧 跟着 的 
类 型 1 规则 An 一 aAv。p 来 代替 类 型 1-2 规则 Apg 一 ApraAsb， 可 以 得 到 相同 的 结果 。 

现在 我 们 用 DK- 测 试 来 证 明 G 是 确定 型 的 。 为 了 实现 这 一 点 ， 我 们 将 会 通过 扩展 P 
的 输入 字母 表 和 转移 也 数 来 处 理 除 终结 符 之 外 的 变 元 符号 ， 从 而 分 析 在 有 效 串 上 P 如 何 操 
作 。 我 们 把 所 有 的 符号 Ap MINE P 的 输入 字母 表 并 通过 定义 6(p,Apa se) 二 (gq,e) 来 扩展 
它 的 转移 函数 6。 令 所 有 其 他 的 转移 包括 An ND. ATAF P 的 确定 性 行为 ， 如 果 P 忆 从 
输入 中 读 入 A pgs AAAI HM ee RARE. 

下 面 的 断言 适用 于 在 L(G〉 中 任 一 串 w 的 派生 ， 例 如 

Ag one 

如 果 也 读 入 包含 一 个 变 元 Am 的 wi， 那么 它 正好 在 读 入 Ap 之 前 进入 状态 p。 

使 用 在 i 上 的 归纳 ， 从 A ,派生 vi 的 步骤 数目 来 证 明 。 

归纳 基础 : ;一 0。 

在 这 种 情况 下 ，wvi 二 Ag ,a,, 且 了 从 状态 qo 开始， 所 以 归纳 基础 正确 。 

归纳 步骤 : 假定 断言 对 i 成立， 证 明 其 对 i 十 1 也 成 立 。 

首先 考虑 如 下 情况 ，w; 二 xApgy 且 Am 是 在 步骤 2 之 w+l 中 替换 的 变 元 。 归 纳 假设 表 
H PECERA TZA, ERATSI Ayg 之 前 进入 状态 pp。 根据 G 的 构造 过 程 ， 蔡 换 规则 可 
能 有 两 种 类 型 : 

l. Am 一 AmwraAvp 或 

2. Agee 

因此 根据 选择 的 规则 类 型 vi+1 = zApaAeby MA vii 二 xy。 在 第 一 种 情况 下 ， 当 P 
Æ viz PA ApyaAsb 时 ， 我 们 知道 它 在 状态 p 开始 ， 因 为 其 刚刚 读 完 zc. Ma P E 
vi+1 中 读 入 ApyaAzb， 由 于 替换 规则 的 构造 ， 它 进入 状态 +，s，t 和 9 组 成 的 序列 。 因 此 ， 
它 正好 在 读 和 人 Ayp 之 前 进入 状态 p， 并 且 正 好 在 读 入 As 之 前 进入 状态 ;3， 从 而 为 这 两 种 变 
元 的 出 现 情况 建立 断言 。 断 言 在 y 部 分 的 变 元 出 现时 成 立 ， 是 因为 在 PP 读 作 b 之 后 它 进入 
状态 g 然后 读 人 串 y。 在 输入 v; 上 ， 它 也 在 读 入 y 之 前 进入 gqg， 所 以 计算 过 程 在 vi M vi 
的 y 部 分 上 是 一 致 的 。 显 然 ， 计 算 过 程 在 z 部 分 也 是 一 致 的 。 因 此 ， 断 言 对 w+1 成 立 。 在 
第 二 种 情况 下 ， 没 有 引入 新 的 变 元 ， 所 以 我 们 只 需要 观察 计算 过 程 在 wi 与 viti1 的 x 和 yy 
部 分 上 是 一 致 的 。 这 就 证 明了 断言 成 立 。 

CEED 6G 能 通过 DK- 测 试 。 

我 们 证 明 每 一 个 DK 的 接受 状态 都 满足 DK- 测 试 的 条 件 。 选 择 这 些 接 受 状 态 中 的 一 
个 。 它 包含 一 个 完整 的 规则 R。 这 个 完整 的 规则 可 能 有 下 面 两 种 形式 之 一 : 

Ll. Ap Ay aAwd. 

i. An 

在 这 两 种 情况 下 ， 我 们 都 需要 证 明 该 接受 状态 不 会 包含 : 

a. 男 一 个 完整 的 规则 ， 


i = Vv P Yv PÈ t D UV a Sue — yf) 


acce 


b. 一 个 含有 终结 符 紧 跟 在 句点 之 后 的 加 点 规则 。 

我 们 分 别 考虑 这 四 种 情况 。 在 每 一 种 情况 中 ， 我 们 从 考虑 一 个 串 z 开始 ，DK 在 > 上 
到 达 我 们 所 选择 的 接受 状态 。 

情况 la R 是 一 个 完整 的 类 型 1-2 规则 。 对 这 个 接受 状态 的 任意 一 个 规则 来 说 ，z 必 
定 以 这 个 规则 中 的 句点 之 前 的 符号 作为 结束 ， 因 为 DK 在 zx 上 到 达 该 状态 。 因 此 在 句点 之 
前 的 符号 在 所 有 这 样 的 规则 中 一 定 是 一 至 的。 这 些 符 号 在 R 中 是 ApaAyb， 所 以 任意 其 他 
类 型 1-2 的 完整 规则 的 右边 一 定 有 相同 的 符号 。 同 样 左边 的 变 元 一 定 也 是 一 致 的 ， 所 以 规 
则 一 定 都 是 相同 的 。 

假定 接受 状态 包含 R 和 某 个 类 型 3 的 完整 HT., AR 中 我 们 知道 z 以 ApaAsb 
结束 。 此 外 ， 我 们 知道 己 在 > 的 最 后 弹 栈 ， 因 为 根据 G 的 构造 过 程 弹 栈 操作 在 尺 的 那个 
位 置 执行 。 根 据 我 们 建立 DK 的 方式 ， 在 某 个 状态 的 完整 = 规则 一 定 由 一 个 加 点 规则 推导 
出 来 ， 该 加 点 规则 驻 留 的 状态 满足 : 句点 不 在 一 开始 的 位 置 且 句点 之 后 紧 接 着 某 个 变 元 。 
(一 个 例外 出 现在 DK 的 开始 状态 ， 这 里 句点 可 能 出 现在 规则 的 开始 位 置 ， 但 是 这 个 接受 
状态 不 能 是 开始 状态 ， 因 为 它 包 含 了 一 个 完整 的 类 型 1-2 规则 .) 这 意味 着 在 G 中 ，T 由 
一 个 类 型 1-2 的 加 点 规则 推导 得 到 ， 在 这 个 规则 中 句点 在 第 二 个 变 元 之 前 。 根 据 G 的 构造 
过 程 ， 一 个 压 栈 操作 正好 在 句点 之 前 出 现 。 这 说 明 己 在 zx 的 最 后 执行 了 一 个 压 人 转移 ， 这 
与 我 们 之 前 的 论断 是 矛盾 的 。 所 以 不 存在 完整 规则 工 。 另 一 方面 ， 任 一 类 型 的 第 二 个 完 
整 规 则 不 会 出 现在 这 个 接受 状态 。 

情况 2a 尺 是 一 个 完整 的 se- 规 则 Am 一 . 。 我 们 证 明 没有 另 一 个 完整 的 = 规则 Aw 一 . 
能 够 与 R 共存 。 如 果 这 样 的 规则 存在 ， 那 么 之 前 的 断言 证 明 在 读 入 z 之 后 P 一 定 在 p 中 
HABA: 之 后 它 也 一 定 在 g 中。 因此 p= 二 gqg， 两 个 完整 的 ee 规则 是 相同 的 。 

情况 1b ”R 是 一 个 完整 的 类 型 1-2 规则 。 从 情况 la 中 ， 我 们 知道 P 在 z 的 最 后 弹 栈 。 
假设 接受 状态 也 包含 一 个 加 点 规则 工 ,在 工 中 一 个 终结 符 紧 跟 在 句点 之 后 。 从 工 中 我 们 
知道 P 不 能 在 z 的 最 后 弹 栈 。 这 个 矛盾 说 明 这 种 情况 是 不 会 出 现 的 。 

情况 2bp”R 是 一 个 完整 的 e 规 则 。 假 设 接受 状态 也 包含 一 个 加 点 规则 T, 在 工 中 一 
个 终结 符 紧 跟 在 句点 之 后 。 因 为 全 是 类 型 1-2 的 ， 所 以 一 个 变 元 符号 之 后 紧 接 着 句点 ， 
那么 z 以 这 个 变 元 符号 作为 结束 。 此 外 ,在 P 读 和 人 zz 之 后 ， 它 为 读 和 人 一 个 非 。 输 入 符号 
做 好 了 准备 ， 因 为 一 个 终结 符 跟 在 句点 之 后 。 就 如 同 在 情况 1a 中， 完整 的 = 规则 R AA 
一 个 类 型 1-2 加 点 规则 S 中 推导 得 到 ， 在 S 中 句点 之 后 紧 接 着 第 二 个 变 元 。 (再 一 次 ， 
这 个 接受 状态 不 能 是 DK 的 开始 状态 ， 因 为 句点 不 在 工 的 开始 位 置 出 现 。) 因此 在 S 中 
某 个 符号 a€ 3 之 后 紧 接 着 出 现 句 点 ， 所 以 z 以 a 作为 结束 。 不 论 是 a€5 还 是 4a 二， 
因为 z 以 一 个 变 元 符号 作为 结束 ，a 攻 所 以 a 二 e。 因 此 ,在 PP 读 人 zz 之 后 ， 在 它 为 处 
H a 执行 = 输入 转移 之 前 ， 它 为 读 入 一 个 s 输 入 做 好 了 准备 。 在 之 前 我 们 也 证 明了 P E 
此 刻 为 读 人 一 个 非 。 输 入 符号 做 好 了 准备 。 但 是 不 允许 DPDA 同时 执行 = 输入 转移 以 及 
在 给 定 状 态 和 栈 读 入 一 个 非 e 输 入 符号 的 转移， 所 以 上 述 情况 不 可 能 出 现 。 因 此 情况 2b 
不 会 发 生 。 a 


2.4.4 ”语法 分 析 和 LR(k) 文法 


确定 型 上 下 文 无 关 语 言 有 着 重要 的 实际 意义 。 它 们 对 于 成 员 关 系 和 语法 分 析 的 算法 都 
基于 DPDA， 因 此 这 些 算法 都 是 高 效 的 ， 且 它们 包含 了 丰富 的 涵盖 大 多 数 编程 语言 的 CFL 
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X. Mit, DCFG 有 时 在 表达 特殊 的 DCFL 时 不 方便 。 其 关于 所 有 句柄 都 是 强制 的 要 求 ， 
对 于 设计 直观 的 DCFG 是 个 障碍 。 

幸运 的 是 ， 一 个 叫 作 LRG) 的 宽泛 文法 类 让 二 者 相得益彰 。 它 们 与 DCFG 非常 近似 ， 
都 允许 到 DPDA 的 直接 转变 。 同 时 它们 在 很 多 应 用 上 有 足够 的 表达 力 。 

LRCR) 文法 的 算法 引入 了 了 前瞻 性 (lookahead). Æ DCFG 中 ， 所 有 的 句柄 都 是 强制 
的 。 一 个 句柄 只 依赖 于 一 个 包括 句柄 的 有 效 串 上 的 符号 ， 不 依赖 于 在 该 句柄 之 后 的 终结 
符 。 在 LRC) 文法 中 ， 一 个 句柄 可 能 也 依赖 于 该 句柄 之 后 的 符号 ， 但 只 依赖 于 其 中 的 前 到 
个 。 首 字母 缩 略 词 LRA RAR: 从 左 到 右 的 输入 处 理 (Left to right input processing) 、 最 
右派 生 (Rightmost derivation) 〈 或 者 等 价 地 ， 最 左 归 约 ) 和 前 脆 的 个 符号 。 

为 了 使 其 更 为 精确 ， 令 h 为 有 效 串 v= 二 xhy 的 一 个 句柄 。 如 果 刀 对 每 一 个 有 效 串 chy 
(chy 满足 yEzE* H y 和 yy 在 它们 前 & 个 符号 上 是 一 致 的 ) 来 说 是 独一无二 的 句柄 ， 那 么 
AX h ÆRE k 所 强制 的 (forced by lookahead &) 。( 如 果 其 中 某 个 串 的 长 度 小 于 &， 那 
么 一 致 的 长 度 与 这 个 短 串 的 长 度 相 同 。) 

若 LR(K) 文 法 的 每 一 个 有 效 串 的 句柄 都 是 被 前 瞻 有 所 强制 的 ， 那 么 该 
LRCE) 文 法 是 上 下 文 无 关 文 法 。 

因此 DCFG 与 LR(0) 文 法 相同 。 我 们 能 够 证 明 对 任意 一 个 &， 能 将 文法 LR(k) 转换 
成 DPDA。 我 们 已 经 证 明 DPDA 与 LR(0) 文 法 等 价 。 因 此 LRCR) 文 法 对 所 有 & 和 所 有 DC- 
FL 的 准确 描述 在 能 力 上 是 等 价 的 。 下 面 的 例子 说 明 ，LR(1) 文法 比 DCFG 更 为 方便 描述 
特定 的 语言 。 

为 了 避免 烦琐 的 符号 和 技术 性 的 细节 ， 我 们 仅 展示 当 &=1 时 如 何 将 LRCR) 文法 转换 
成 DPDA。 更 为 一 般 性 的 转换 过 程 在 本 质 上 与 此 相同 。 

首先 ， 我们 提出 一 个 为 LR(1)〉 文 法 做 了 修改 的 DK- 测 试 的 变形 ， 我 们 将 其 称 为 前 瞻 
为 1 的 DK- 测试 ， 或 简 记 为 DK -测试 。 如 之 前 一 样 ， 我 们 将 构造 一 个 NFA， 这 里 称 为 
Ki1， 并 将 其 转换 成 DFA DK1。Ki 的 每 一 个 状态 都 有 一 个 加 点 规则 Tu. v 和 一 个 称 为 前 
MIS (lookahead symbol) 的 终结 符 a， 表 示 成 (Truv 4 ]。 这 个 状态 说 明 Ki 最 近 已 
AAT Ru, WR vÆEu 之 后 出 现 并 且 a 在 v 之 后 出 现 ,w 可 能 为 句柄 xm 的 一 部 分 。 

绝 大 部 分 的 形式 化 构造 工作 与 之 前 的 相同 。 对 每 一 个 包括 起 始 变 元 S1 和 所 有 ae Sw 
规则 ， 开 始 状态 有 一 个 到 (Sim. ua ] 的 e- 转 移 。 变 换 转变 〈shift transition) 在 输入 zx 上 
将 [T>w zu a ] 变 为 [>uz.v a), 这 里 x 是 一 个 变 元 符号 或 者 终结 符 。 对 每 一 个 规则 
Cor, #48 (etransition) 将 (T>u.Cu a] 变 为 [C 习 .+ b), 这 里 5 是 能 从 v 中 派生 
出 来 的 任意 终结 符 串 的 第 一 个 符号 。 如 果 wv 派生 出 e， 那 么 添加 5 二 a。 对 完整 规则 Bu. 
和 aE€3， 所 有 的 接受 状态 都 是 

S Ri ERAS al 的 完整 规则 ，R。 是 带 前 瞻 符 号 a: 的 加 点 规则 。R1 和 Rs 是 一 
BAY (consistent), a 

1. Ro 是 完整 的 且 ai 二 a。， 或 

2. Ro 不 是 完整 的 且 a 紧 跟 在 句点 之 后 。 

现在 我 们 已 经 做 好 准备 来 描述 DK -测试 。 构 造 DFA DK1。 测 试 保证 每 一 个 接受 状 
态 一 定 不 包含 任意 两 个 一 致 的 加 点 规则 。 
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G 通过 DK1- 测 试 当 且 仅 当 G 是 一 个 LR(1) 文法 。 
证 明 思 路 ”推论 2. 32 仍 适用 于 DK1， 因 为 我 们 可 以 忽略 前 瞻 符 号 。 8 
这 个 例子 说 明了 下 面 的 文法 通过 了 DRK1 -测试 CLA 2- 22) 。 回 忆 在 例 
2.34 中 这 个 文法 不 能 通过 DK- 测 试 。 因 此 它 是 一 个 LR(1) 文法 的 例子 而 不 是 一 个 DCFG 
的 例子 。 
S>E- 
E>E+T|T 
T>TXala 


S+.E4 atx S+EA atx 
E+E.4T 44 


一 
十 


E>+E+-T 4 T 
T>-TXa x+4 
Tea x+ 


T=T-Xa 





Al 2-22 通过 DK: - Wit n 
结束 标记 语言 由 LR(1) 文 法 生成 当 且 仅 当 它 是 一 个 DCFL。 

我 们 已 经 证 明了 每 一 个 DCFL 都 有 一 个 LR(0) 文法 ， 因 为 一 个 LR(0) 文法 与 一 个 
DCFG 相同 。 这 就 证 明了 定理 的 必要 性 。 剩 下 的 就 是 下 面 这 个 引 理 ， 说 明了 如 何 将 LR(1) 
文法 转换 成 DPDA。 

每 一 个 LR(1) 文法 都 有 一 个 等 价 的 DPDA。 

证 明 思 路 ”我们 构造 Pi ， 一 个 我 们 在 引 理 2. 45 中 提 到 的 DPDA P 的 修改 版 本 。Pi 
读 入 它 的 输入 并 模拟 DK1 ， 同 时 使 用 栈 来 记录 若 所 有 归 约 步骤 应 用 于 目前 的 输入 ，DK， 
可 能 进入 的 状态 。 此 外 ，P1 向 前 读 入 1 个 符号 并 将 这 个 前 瞻 信 息 存储 到 它 的 有 穷 状态 存 
fiğ (finite state memory) 中 。 每 当 DK; 达到 一 个 接受 状态 ，P1 查询 它 的 前 有 瞻 来 判断 是 否 
执行 一 个 归 约 步骤 ， 并 在 有 多 种 可 能 时 判断 执行 哪 一 个 步骤 。 因 为 文法 是 LR(1)， 所 以 只 


有 一 种 选择 。 = 
练习 
2.1 回忆 一 下 例 2. 3 中 给 出 的 CFG Gs 。 为 方便 起 见 ， 用 单字 母 重新 命名 它 的 变 元 如 下 : 
E-E+T|T 
T>TXFI|F 
F+(E)|a 
给 出 下 述 字 符 串 的 语法 分 析 树 和 派生 : 


a. a b. ata c.atata d. ((a)) 
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2.2 a. 利用 语言 A 二 {a™"b"c*|m,n 宇 0} 和 B={a" b"e” |m, n=0)}) 以 及 例 2.20， 证 明 上 上 下文 无 关 语 言 
类 在 交 运 算 下 不 封闭 。 
b. FIFA (a) ME. ERE (定理 0.10), 证 明 上 下 文 无 关 语言 类 在 补 运算 下 不 封闭 。 
A2.3 设 上 下 文 无 关 文法 G: 


R—>XRXI|S 

S—aTb|bTa 

T>~XTX|Xle 

X—alb 
回答 下 述 问题 : 
a. G 的 变 元 是 什么 ? b. G 的 终结 符 是 什么 ? 
c.G 的 起 始 变 元 是 什么 ? d. 给 出 L(G) 中 的 3 个 字符 串 。 
e 给 出 不 在 工 (G) 中 的 3 个 字符 串 。 f. 是 真是 假 : T =>aba. 
g. 是 真是 假 : T =>aba, h HEB: ToT. 
i 是 真是 假 : TST. j 是 真是 假 : XXX =>aba, 
k. 是 真是 假 : X Saba, L BABE: TSXX, 
m RER: TSXXX. n EHER: SSe, 


o 用 普通 的 语言 描述 L(G). 
2.4 WERTH (0,1},， 给 出 产生 下 述 语言 的 上 下 文 无 关 文 法 : 
Aa {w|w 至 少 包 含 3 个 1}. 
b. {w|w 以 相同 的 符号 开始 和 结束 }。 
c. (w w 的 长 度 为 奇数 }。 
Ad. (w| w 的 长 度 为 奇数 且 正 中 间 的 符号 是 0} 。 
e (w|w=wR®, 即 多 是 一 个 回 文 }。 
f. FE. 
2.5 给 出 关于 练习 2. 4 中 语言 的 下 推 自动 机 的 非 形式 化 描述 和 状态 图 。 
2.6 给 出 产生 下 述 语言 的 上 下 文 无 关 文 法 : 
Aa. 字母 表 (a, b 上 a 多 于 b 的 所 有 字符 串 组 成 的 集合 。 
b. 语言 {a"b” | ”之 0} 的 补 集 。 
Ac {wHr|w,rE{0,1)* Hur Bc hfs}. 
d. {zi #22 #0 Harl k >l, 每 一 个 rE {a,b}* ， 且 存在 i 和 j 使 得 zx; 二 zxR}。 
A 2.7 给 出 关于 练习 2.6 中 语言 的 PDA 的 非 形式 描述 。 
A 2.8 证 明 在 2.1 节 开始 部 分 给 出 的 文法 G P, ZE “the girl touches the boy with the flower” 有 两 
个 不 同 的 最 左派 生 ， 令 述 这 人 句 话 的 两 个 不 同 的 意思 。 
2.9 给 出 产生 语言 
A=({aib’c*|i,7,k>0 H i=j Mj =k} 
的 上 下 文 无 关 文 法 。 你 给 出 的 文法 是 歧义 的 吗 ? 为 什么 ? 
2.10 给 出 识别 练习 2. 9 中 语言 A 的 下 推 自动 机 的 非 形式 化 描述 。 
2.11 用 定理 2. 12 中 给 出 的 过 程 ， 把 练习 2.1 中 的 CFG G4 转换 成 等 价 的 PDA。 
2.12 ”用 定理 2. 12 中 给 出 的 过 程 ， 把 练习 2.3 中 的 CFG G 转换 成 等 价 的 PDA。 
2.13 设 文法 C 一 (V,3,R,S)， 其 中 V 一 1S,T,U),Z 一 {0,#}， 尺 是 下 述 规则 的 集合 : 
S—TT|U 
T—0T|T0| # 
U—>0U00| # 
a. 用 普通 的 语言 描述 LCG., 
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b. 证 明 L(G) 不 是 正则 的 。 
用 定理 2.6 中 给 出 的 过 程 ， 把 下 述 CFG 转换 成 等 价 的 乔 姆 斯 基 范 式 文 法 。 

A—BAB|Ble 

B00 |e 
给 出 一 个 反例 证 明 下 述 构 造 不 能 证 明 上 下 文 无 关 语 言 类 在 星 号 运算 下 封闭 , 设 CFL A H CFG G 
=(V,5,R,S) 产生 ， 将 G 增 加 一 条 新 规则 S 一 SS 并 称 其 为 G ， 这 个 语法 可 产生 语言 A* 。 
证 明 上 下 文 无 关 语言 类 在 并 、 连 接 和 星 号 三 种 正则 运算 下 封闭 。 
先 说 明 如 何 把 正则 表达 式 直接 转换 成 等 价 的 上 下 文 无 关 文 法 ， 然 后 利用 练习 2. 16 的 结果 ， 给 
出 每 一 个 正则 语言 都 是 上 下 文 无 关 的 男 一 种 证 明 。 


考虑 下 面 的 CFG G: 

SSS| T 

T—aTb | ab 
描述 L(G) 并 证 明 G 是 歧义 的 。 给 定 一 个 非 歧义 文法 H, WE LCH)=L(G), fi BiEW H Æ 
非 歧 义 的 。 
我 们 定义 语言 A 的 旋转 闭 包 (rotational closure) 为 人 CC(A)=({(yzlzyEA})。 证 明 CFL 类 在 旋 
转 闭 包 下 是 封闭 的 。 
我 们 定义 语言 A 的 CUT 为 CUT(A) 二 {yzxz|zxyzE A}. 证明 CFL 类 在 CUT 下 不 是 封闭 的 。 
证 明 每 一 个 DCFG 是 一 个 非 歧 义 的 CFG. 
证 明 每 一 个 DCFG 产生 一 个 前 缀 无关 语言 。 
证 明 DCFL 类 在 下 面 的 运算 下 不 是 封闭 的 : 
a. 并 b. 交 c 连接 d. 星 号 e. jf 
设 下 面 的 文法 为 G: 

S>T- 
T—TaTb| TbTale 

a. 证 明 LCG) = (w |w 包 含 相同 个 数 的 a 和 b}。 通 过 使 用 在 w 的 长 度 上 的 归纳 法 来 证 明 。 
b. 使 用 DK- 测 试 来 证 明 G 是 一 个 DCFG 。 
c. 描述 DPDA 识别 LOD 的 过 程 。 
设 例 2.28 中 引入 的 如 下 文法 为 G. EA DK- 测 试 来 证 明 Cl 不 是 一 个 DCFG。 

RS 到 

S—aSb|ab 

T—aTbb| abb 
设 A=L(G), G 在 问题 2.25 中 已 被 定义 。 证 明 A 不 是 一 个 DCFL。 (提示: 假设 A 是 一 个 
DCFL， 考 虑 它 的 DPDA P。 修 改 PP 使 其 输入 字母 表 为 {a,b,c}。 当 它 第 一 次 进入 一 个 接受 状 
态 时 ， 从 此 时 开始 其 假定 输入 中 的 c 都 是 b。 修 改 的 书 能 够 接受 什么 语言 ?) 
设 B= {abc |i, jr k20 H i=j Mi=k}. EH 了 不 是 一 个 DCFL。 
设 C={ww® |wE {0,1}*}. WH C 不 是 一 个 DCFL。( 提 示 : 假设 当 某 个 DPDA PP 在 其 栈 的 最 
顶部 的 带 有 符号 z 的 状态 g 开始 时 ， 无 论 P 在 此 时 读 人 了 怎样 的 输入 串 ，P 都 不 弹出 在 x 下 面 
的 栈 。 在 这 种 情况 下 ， 此 时 PP 栈 的 内 容 不 会 影响 它 接 下 来 的 行为 ， 所 以 P 接 下 来 的 行为 只 依赖 
FqAlz.) 
如 果 我 们 不 允许 在 CFG 中 有 e 规 则 ， 那 么 可 以 简化 DK- 测 试 。 在 简化 后 的 测试 中 ， 我 们 只 需 
要 检查 DK 的 每 一 个 接受 状态 是 否 有 一 个 单一 的 规则 。 证 明 一 个 不 带 e 规 则 的 CFG 能 够 通过 简 
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化 后 的 DK- 测 试 当 且 仅 当 它 是 一 个 DCFG, 
a 设 C 是 上 下 文 无 关 语 言 ，R 是 正则 语言 。 证 明 语 言 C1|R 是 上 下 文 无 关 的 。 
b. 利用 (a) WHER 
A={w|w€ {a,b,c)* ,和 且 含有 数目 相同 的 a、.b 和 c} 
不 是 上 下 文 无 关 的 。 
设 有 CFG G: 
S—>aSb|bY|Ya 
Y—>bY |aY |e 
用 通常 的 语言 给 出 L(G) 的 简单 描述 ， 并 利用 这 个 描述 给 出 L(G) 的 补 集 L(G) 的 CFG. 
i A/B= {w| wrE€A, H x€B}, 证 明 如 果 A 是 上 下 文 无 关 语 言 且 B 是 正则 语言 ， 则 A/B 是 
上 下 文 无 关 语 言 。 
WEE I= {a,b}， 给 出 产生 所 有 a 的 个 数 是 b 的 两 倍 的 字符 串 的 语言 的 CFG， 并 证 明 其 正 
确 性 。 
 C={x# ylz,yE{0,1}*, Hay}, ÆRA CHE FMRAKBE. 
设 D={zylz,yE{0,1}*, Hlzl|=|y| (hrcA y}, HEA DREPFRAKAG. 
设 E= {a bi |i 关 7 H 2i~Aj}, WH ERE FREKBG. 
对 任 一 语言 A， 令 运算 符 SUFFIX(A) = (0| FER u, fF uve A}, 证 明 上 下 文 无 关 语 言 类 在 
SUFFIX 运算 下 封闭 。 
设 G 是 一 个 乔 姆 斯 基 范 式 CFG, ER: 对 于 任 一 长 度 为 n(n 宇 1) 的 字符 串 wEL(G), 通过 
CFG G 将 其 派生 出 来 恰好 需要 2n 一 1 步 。 
设 文法 G=(V,5,R,(STMT)) WF: 
(STMT)—(ASSIGN) | (IF-THEN) | (IF-THEN-ELSE) 
(IF-THEN)—if condition then (STMT) 
(IF-THEN-ELSE)— if condition then (STMT) else (STMT) 
(ASSIGN)—a:=1 
>= (if, condition, then, else,a: =1} 
V={<(STMT), (IF-THEN) , (IF-THEN-ELSE) , (ASSIGN) } 
G 是 程序 设计 语言 的 一 个 片断 的 文法 ， 虽 然 看 上 去 很 自然 ， 但 它 是 有 歧义 的 。 
a. WEAR G 是 歧义 的 。 
b. 给 出 一 个 与 G 产生 相同 语言 的 非 层 义 文法 。 
给 出 下 列 语言 的 非 歧 义 CFG: 
a. { 蕊 | 对 于 芭 的 每 一 个 前 级 ，a 的 个 数 不 小 于 b 的 个 数 )》 
b. {wlw 中 a 的 个 数 和 bb 的 个 数 相 等 ) 
c. {w|w 中 a 的 个 数 不 小 于 b} 
证 明 练 习 2. 9 中 的 语言 A 是 固有 歧义 的 。 
用 有 泵 引 理 证 明 下 述 语言 不 是 上 下 文 无 关 的 : 
a. {0"1"0"1"|n>0} 
Ab. {07 #02" #03” |n>0} 
Ac {witt|w,t€{a,b}*, Hwt NFB) 
d. (ti H tz Hoe Ht, |RE2,t;€ (a,b)* , HAF iF] Bt; =2;} 
设 语言 BA (0,1) 上 具有 回 文 性 质 的 字符 串 组 成 且 0，1 个 数 相同 ， 证 明 B 不 是 上 下 文 无 关 的 。 
对 于 字母 表 3 一 (1,2,3,4}) 上 的 语言 C=(wes* | 在 双 中 ,1 与 2 的 个 数 相 同 ,3 与 4 的 个 数 相 
fl}, 证明 C 不 是 上 下 文 无 关 语 言 。 
证 明 语 言 F= {abi | FEER% k, € ixkj} 不 是 上 下 文 无 关 的 。 
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2.46 考虑 语言 BLG), 其 中 G 是 练习 2. 13 中 给 出 的 文法 ， 定 理 2. 19 关于 上 下 文 无 关 语 言 的 泵 引 
理 称 存在 关于 B 的 有 泵 长 度 p。 试 计算 p 的 最 小 值 并 验证 结果 的 正确 性 。 
2.47 设 G 是 一 个 含有 2 个 变 元 的 乔 姆 斯 基 范 式 CFG, 证 明 : 如 果 G 派 生出 某 个 字符 串 时 使 用 了 至 少 
224}, M L(G) 是 无 穷 的 。 
2.48 试 给 出 一 个 语言 示例 ， 它 不 是 上 下 文 无 关 的 ， 但 却 满足 CFL 关于 泵 引 理 的 三 个 条 件 。 要 求 给 出 
证 明 (参考 问题 1. 49 中 关于 正则 语言 的 类 似 示例 )。 
* 2.49 证明 下 述 强 泵 引 理 ， 要 求 在 划分 字符 串 sht, vA y 都 非 空 。 
MRA 是 上 下 文 无 关 语 言 ， 则 存在 一 个 数 k， 使 得 A 中 任 一 长 度 不 小 于 & 的 字符 串 都 可 以 划分 
成 5 段 ，s 二 wzyz， 且 满足 下 述 条 件 : 
a. 对 每 一 个 i20, uv'izy'zEA, 
b. ve A ye, 
c. | vry| >k. 
A2.50 参照 问题 1.31 中 关于 perfect shuffle 运算 符 的 定义 ， 证 明 上 下 文 无 关 语 言 类 在 perfect shuffle ia 
算 下 不 封闭 。 
2.51 参照 问题 1. 32 中 关于 shuffle 运算 符 的 定义 ， 证明 上 下 文 无 关 语 言 类 在 shuffle 运算 下 不 封闭 。 
"2.52 ”对 于 一 个 语言 中 的 任 一 字符 串 ， 如 果 串 的 所 有 前 缀 也 在 这 个 语言 内 ， 则 称 该 语言 是 前 封闭 的 。 
证 明 : 一 个 无 穷 大 的 前 封闭 上 下 文 无 关 语 言 C 包含 一 个 无 穷 大 的 正则 语言 子 集 。 
*2.53 理解 问题 1. 45 中 关于 NOPREFIX(A) 及 NOEXTEND(A) 的 定义 并 证 明 : 
a. 上 下 文 无 关 语 言 类 在 NOPREFIX 下 不 封闭 。 
b. 上下文 无 关 语 言 类 在 NOEXTEND 下 不 封闭 。 
"2.54 ”对 于 字母 表 2 一 (1,#}) WRR Y= (wl w=t # t: #' Hte HP k20, 4E1*, HM iF;, 
A tAt;}, HAY RAE PF RMEKBS. 
2.55 对 于 字符 串 w 和 上， 如 果 二 者 字符 数 相等 且 组 成 的 字符 相同 〈 只 是 字符 在 串 中 的 顺序 不 同 )， 则 


称 w 三 1。 在 此 基础 上 给 出 SCRAMBLE 定义 如 下 : 对 字符 串 w, A SCRAMBLE(w)=(t|t S 
w} ， 对 语言 A， 有 SCRAMBLE(A)=(t| FE wEA, 使 得 tE SCRAMBLE(w)}. 
a. 证 明 : 给 定 字 母 表 3=={0,1}， 正 则 语言 SCRAMBLE 运算 后 成 为 上 下 文 无 关 语 言 。 
b， 当 字母 表 包 含 3 个 或 更 多 符号 时 会 有 什么 样 的 结果 ? 证 明 你 的 结果 。 

2.56 EWR A, B, § AQB={zyl]lrEA, yEB,H|zl=|yl}, WHA: Ww A，B 是 正则 语言 ， 则 
AQB EFEK. 

*2.57 i A={uwtw® |w,tE{0,1})* H]wl=l|el}, 证 明 A 不 是 上 下 文 无 关 语 言 。 

2.58 设 2= 二 {0,1}，B 为 后 一 半 中 至 少 包 含 一 个 1 的 串 的 集合 。 换 句 话 说 ，B= 二 {uv|uE€53*,vE€ 
S| i. 
a. 设计 一 个 能 识别 B 的 PDA, 
b. 设计 一 个 能 识别 B 的 CFG. 

2.59 设 2 一 (0,1)，Cl 为 在 三 分 段 中 间 部 分 包含 一 个 1 的 所 有 串 的 语言 ，Cz 为 在 三 分 段 中 间 部 分 包 
含 两 个 1 的 所 有 串 的 语言 。 所 以 Cl 二 {zyz|zx,zE3*,y€E3*15*,|z|==|z| 宇 |y|}),C;: = 
{xyz|z,zEd* ,yEd* 13*15* ,|z|=|z| 宇 |y|}. 


a. 证 明 Gi 是 CFL, b. 证 明 C: AR CEL, 
习题 选 解 
23 eK, Aas Ta b. a, b; 
c. R; d. G 的 三 个 字符 串 为 ab，ba，aab; 


e 不 在 G 中 的 三 个 字符 串 为 a，b，s; f. False; 
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g. True; h. False; 
i. True; j. True; 
k. False; l. True; 
m. True; n. False; 


o L(G) 包含 所 有 不 具有 回 文 性 质 的 a、b 串 。 
a. S>R1R1R1R R~OR | 1R|e 
d. S—>0 | 0S0 | 0S1 | 1S0 | 1S1 
a. S>TaT 
T—TT|aTb|bTa|ale 
工 生 成 的 字符 串 满 足 a 的 个 数 不 少 于 b 的 个 数 ，S 使 得 a 的 个 数 增加 1。 
¢ STA 
T—0T0|1T1| #X 
X—>0X|1X |e 
a. PDA 用 栈 计算 出 a 的 个 数 减 去 b 的 个 数 的 值 ， 当 计数 为 正 数 时 进入 接受 状态 。 具 体操 作 如 下 : 
PDA 扫描 输入 ， 如 果 栈 项 为 a 时 其 读 到 b， 则 将 a 弹出 栈 顶 。 如 果 栈 顶 为 b 时 其 读 到 a， 则 将 b 
弹出 栈 顶 。 如 果 栈 顶 值 与 读 到 的 值 相 同 ， 则 将 读 到 的 字符 压 人 栈 。 扫 描 结束 后 ， 如 果 栈 项 为 a 则 
接受 ， 否则 拒绝 ，。 
PDA 扫描 输入 并 将 值 压 入 栈 直 至 其 读 到 字符 # ， 如 果 没 有 出 现 # ， 则 拒绝 。 然 后 PDA 在 输入 上 
随机 移动 ， 并 非 确 定性 地 在 某 一 时 刻 停止 移动 ， 在 停止 点 ，PDA 将 下 一 个 输入 字符 与 栈 顶 符号 
进行 比较 ， 只 要 不 匹配 或 者 在 栈 非 空 的 情况 下 已 经 完成 对 输入 的 扫描 ， 则 拒绝 该 分 支 。 在 没 结 
束 扫 描 输 入 情况 下 如 果 栈 被 清空 ， 则 PDA 读 取 余下 的 输入 并 进入 接受 状态 。 
派生 过 程 如 下 : 
《句子 ?一 《名词 短语 》( 动 词 短语 一 
(复杂 名 词 );)( 动 词 短语 ) 一 
《和 冠 词 )( 名 词 )( 动 词 短语 一 
The 名词;( 动 词 短 语 ) 一 > 
The girl 《动词 短语 ) 一 
The girl (复杂 动词 (介词 短语 一 
The girl (动词 (名 词 短 语 )( 介 词 短 语 一 
The girl touches《〈 名 词 短 语 》)( 介 词 短 语 ) 一 
The girl touches (复杂 名 词 )( 介 词 短 语 ) 一 
The girl touches 〈 冠 词 )( 名 词 )( 介 词 短 语 ) 一 
The girl touches the (名词); (介词 短语 ;一 
The girl touches the boy 介词 短语 一 
The girl touches the boy (介词 )( 复 杂 名 词 ); 一 
The girl touches the boy with (复杂 名 词 ) 一 
The girl touches the boy with 〈 冠 词 )( 名 词 ) 一 
The girl touches the boy with the ‘名词; 一 
The girl touches the boy with the flower 
另 一 种 最 左派 生 方法 如 下 : 
(句子) 悦 ( 名 词 短 语 ) (动词 短语 ; 一 
(复杂 名 词 )( 动 词 短 语 ; 一 
( 冠 词 )( 名 词 )( 动 词 短 语 ; 一 
The (名 词 )( 动 词 短 语 ; 一 


p 
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The girl (动词 短语 ; 一 

The girl (复杂 动词 〉 一 

The girl (动词 );( 名 词 短 语 ; 一 

The girl touches (名 词 短 语 ; 一 

The girl touches (复杂 名 词 );( 介 词 短 语 ; 一 

The girl touches〈 冠 词 );( 名 词 ;《 介 词 短 语 ) 一 

The girl touches the (4% 17) (介词 短语 一 

The girl touches the boy (介词 短语 ; 一 

The girl touches the boy 介词) 复杂 名 词 》 一 

The girl touches the boy with (4 44% ia]) —> 

The girl touches the boy with 〈 冠 词 )( 名 词 ) 一 

The girl touches the boy with the ‘(名词 ) > 

The girl touches the boy with the flower 

每 个 派生 对 应 不 同 的 意思 ， 对 于 第 一 个 派生 ， 句 子 的 意思 是 女孩 用 花 去 碰 男 孩 ; 第 二 个 派生 表明 

当 女 孩 碰 男孩 时 他 正 拿 着 花 。 

我 们 使 用 反 证 法 证 明 。 假 定 记 和 wz ELO 中 两 个 不 相同 的 串 ， 这 里 G 是 一 个 DCFG。 二 者 都 

是 有 效 串 所 以 二 者 都 有 句柄 ， 且 这 些 句 柄 一 定 一 致 ， 因 为 我 们 可 以 写成 w= xrhy 和 wz = chyz= 

zhy， 这 里 是 w 的 句柄 。 因 此 ，w 和 wz 的 第 一 个 归 约 步骤 分 别 产 生 有 效 串 x 和 wuz。 我 们 继续 

这 个 过 程 直 到 得 到 Si 和 Siz, AE S 是 起 始 变 元 。 然 而 Si 并 不 会 出 现在 任何 规则 的 右边 ， 所 以 

我 们 不 能 归 约 S1z。 这 就 是 一 个 矛盾 。 

a 设 C 为 上 下 文 无 关 语 言 ，R 为 正则 语言 ，P 为 识别 C 的 PDA, D 为 识别 R W DFA, QAP 的 
状态 集 ，Q 为 D 的 状态 集 ， 构 造 一 个 PDA PAFIRG COR, PHRABHOQXQ. WP 
实现 P 的 动作 的 同时 还 能 记录 下 的 状态 。 它 能 且 只 能 接受 在 状态 CC Fp X Fp 处 停机 的 字符 
Hw, HH Fp 是 P 的 接受 状态 集 ，FDp 是 DD 的 接受 状态 集 ， 因 为 CNR 能 被 P' 识 别 ， 故 其 为 
EPRMAURBE. 

. BR EIEWAA a* b*c*, MRABCFL, WRE (a) 有 ANR 也 是 CFL， 然 而 对 于 AN 站 R= 
{a"b"c” | n>0}, AP 2. 20 得 证 其 不 是 上 下 文 无 关 语言 ， 因 此 A 不 是 上 下 文 无 关 语 言 。 

b. i B={0" #0?" #09"|n>0}, pARKE, WFLA s=0? $072 403%, 我 们 证 明 s 二 wvzryz 

不 能 被 抽取 。 

vA y 都 不 可 能 包含 # ， 否 则 rowy: 将 多 于 两 个 #， 如 果 把 s 用 # 分 为 三 段 0* 077, 08, 

则 至 少 有 一 段 不 能 包含 vy, K zwwy:z 不 在 B 中 ， 否 则 不 能 保持 三 段 0 的 个 数 的 比例 。 
c. 设 C=={w#t| 其 中 忆 是 t HTE, w, tE {a b)*)}. RPARKE, s=atb? Habt, RITER F 

符 串 s 二 wvxyz 不 能 被 抽取 。 

vAly PEBR H, BW ui cyz KAAS H, AMSA RAE CH. WR vM y 都 非 空 并 

出 现在 # 的 左边 ， 则 xwzxzyz 因 其 # 左 边 字符 多 于 # 右边 字符 而 不 在 C HF, MF v、y PEF 

的 右边 ， 同 理 有 xw sy ez 也 不 在 C 中 。 对 于 v、y 中 有 一 个 非 空 的 情况 ， 则 把 它们 看 作 都 出 现 

在 # 的 同一 边 处 理 。 

还 有 一 种 情况 是 v、y 都 非 空 且 出 现在 # 的 两 边 ， 这 种 情况 下 必 有 wv 只 包含 a，y 只 包含 b (由 
泵 定理 条 件 3，| vzy | SH), AM uP ry z P HEAR b 多 于 右边 的 b， 因 此 其 不 在 C 中 。 
A={0*1* |k>0}, B={a'b**|k>0}, EMM sé lB MAZE (perfect shuffle) 操作 产生 的 语言 C= 

{(O0a)* (Ob)*(1b)?* |k>0}, FABH AMBHCFL, 但 C 不 是 CFL, 证 明 如 下 : 

如 果 C 是 CFL, KH pp AHRKE. s=(0a)? (0b)? (1b). AsMKEKF p ASEC, 有 ;s= 

uvzyz 满足 泵 定理 的 三 个 条 件 。C 中 的 字符 串 有 1/4 长 度 的 1，1/8 长 度 的 a，uv?xy?z 也 应 该 满 

EXPER, Ak vry 必然 同时 包含 1 Aa, 但 因为 它们 被 2p 个 字符 分 开 且 | wzy | <p, FAR 

是 不 可 能 的 ， 从 而 有 C 不 是 上 下 文 无 关 的 。 


5 


| 第 二 部 分 


Introduction to the Theory of Computation, 3e 


可 计算 性 理论 





第 3 章 | 


Introduction to the Theory of Computation, 3e 


乓 可 -图 灵 论 题 





本 书 第 一 部 分 已 经 给 出 了 计算 设备 的 一 些 模型 。 有 穷 自动 机 能 较 好 地 描述 存储 资源 较 
少 的 设备 ， 下 推 自动 机 虽然 能 描述 具有 无 限 存储 的 设备 ， 但 其 “后 进 先 出 ”的 栈 机 制 使 其 
能 力 受 到 限制 ， 还 证 明了 这 些 模型 对 于 有 些 非常 简单 的 任务 都 不 能 完成 。 由 于 它们 过 于 局 
限 ， 因 此 不 能 作为 计算 机 的 通用 模型 。 


3.1 图 灵机 


现在 介绍 一 个 能 力 更 强 的 计算 模型 ， 该 模型 由 图 录 (Alan Turing) 在 1936 FHH, 
称 为 图 灵机 (Turing machine)。 图 灵机 与 有 穷 自动 机 相似 ,但 它 有 无 限 大 容量 的 存储 且 
可 以 任意 访问 内 部 数据 。 图 灵机 是 一 种 更 加 精确 的 通用 计算 机 模型 ， 能 模拟 实际 计算 机 的 
所 有 计算 行为 。 然 而 图 灵机 也 有 不 能 解 的 问题 ， 事 实 上， 这 些 问 题 已 经 超出 了 计算 理论 的 
极限 。 

图 灵机 (图 3-1) 用 一 个 无 限 长 的 带子 作为 无 限 存储 ， 它 有 一 个 读 写 头 ， 能 在 带子 上 
读 、 写 和 左右 移动 。 UTIRAR N TAAA 
入 串 ， 其 他 地 方 都 是 空 的 ， 如 果 需 要 保存 信息 ， 它 可 将 
这 个 信息 写 在 带子 上 。 为 了 读 已 经 写 下 的 信息 ， 它 可 将 pooconn i 
RKL K AAAA ENEM. DA e it 图 3-1 图 灵机 的 示意 图 
算 ， 直 到 产生 输出 为 止 。 机 器 预 置 了 接受 和 拒绝 两 种 状态 ， 如 果 进 入 这 两 种 状态 ， 就 产生 
输出 接受 (accept) 或 拒绝 (reject)。 如 果 不 能 进入 任何 接受 或 拒绝 状态 ， 就 继续 执行 下 
E, 永 不 停止 。 

下 面 是 有 穷 自 动机 与 图 灵机 之 间 的 区 别 : 

1. 图 灵机 在 带子 上 既 能 读 也 能 写 。 

2. 图 灵机 的 读 写 头 既 能 向 左 也 能 向 右 移动 。 

3. 图 灵机 的 带子 是 无 限 长 的 。 

4. 图 灵机 进入 拒绝 和 接受 状态 将 立即 停机 。 

考虑 图 灵机 Mi ， 它 检查 语言 B=(wHwl wE {(0,1)*) 的 成 员 关 系 ， 即 要 设计 M, 
使 得 如 果 输 入 是 B 的 成 员 ， 它 就 接受 ， 否则 拒绝 。 为 更 好 地 理解 Mi ， 假 设 你 自己 是 Mi， 
想象 你 正 站 在 由 数 百 万 个 字符 构成 的 一 英里 长 的 一 个 输入 上 ， 你 的 任务 是 确定 这 个 输入 是 
否 是 B 的 成 员 ， 亦 即 ， 确 定 这 个 输入 是 否 包 含 由 符号 划分 开 的 两 个 相同 的 字符 串 。 这 个 输 
入 太 长 ， 你 很 难 全 部 记 住 ， 但 允许 你 在 这 个 输入 上 来 回 移动 ， 并 可 以 做 记号 。 一 个 简单 的 
解决 办 法 如 下 : 在 # 两 边 对 应 的 位 置 上 来 回 移动 ， 以 检查 它们 是 否 匹 配 ， 并 使 用 记号 来 记 
录 对 应 的 位 置 。 

按 上 述 方法 设计 M1， 让 读 写 头 在 输入 串 上 多 次 通过 ， 每 一 次 匹配 # 两 边 的 一 对 字符 。 
为 了 记录 哪些 字符 已 经 被 检查 过 ，Mi 消去 所 有 已 检查 过 的 符号 。 如 果 最 后 所 有 的 符号 都 
被 消去 ， 意 味 着 匹配 成 功 ，Mi 进入 接受 状态 ; 如 果 发 现 一 个 不 匹配 ， 就 进入 拒绝 状态 。 
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Mi 的 算法 如 下 : 
Mi 二 “对 于 输入 字符 串 w: 
1. 在 # 两 边 对 应 的 位 置 上 来 回 移动 。 检 查 这 些 对 应 位 置 是 否 包含 相同 的 符号 ， 
如 不 是 ， 或 者 没有 # ， 则 拒绝 。 为 记录 对 应 的 符号 ， 消 去 所 有 检查 过 的 符号 。 
2. 当 # 左 边 的 所 有 符号 都 被 消去 时 ， 检 查 上 # 的 右边 是 否 还 有 符号 ， 如 果 是 ， 则 
拒绝 ， 否 则 接受 。” = 
图 3-2 是 MI 在 输入 011000 #011000 开始 之 911000#011000L... 
后 ，Mi 带子 的 几 个 非 连续 的 快照 。 iiot 10 O Ow ... 
对 图 灵机 MI 的 描述 概略 地 说 明了 一 般 图 灵机 24, o00nk 100d... 
的 工作 方式 ， 这 里 没有 给 出 其 全 部 细节 。 像 引入 有 ”一 
穷 自动 机 和 下 推 自动 机 时 所 做 的 那样 ， 使 用 形式 化 *¥11000#x11000u... 
描述 可 以 描述 图 灵机 的 全 部 细节 。 形 式 化 描述 简短 xX1000#x11000u... 
地 说 明 图 灵机 模型 的 形式 化 定义 中 的 每 个 部 分 , 实 xxxxx#xxxxxxt 
际 中 ， 为 避免 过 于 烦琐 ， 很 少 使 用 图 灵机 的 形式 化 接受 


描述 。 图 3-2 图 灵机 Mi 对 输入 0110004 
l 011000 的 计算 示意 图 
3.1.1 图 灵机 的 形式 化 定义 


图 灵机 定义 的 核心 是 转移 函数 $， 它 说 明了 机 器 如 何 从 一 个 格局 走 到 下 一 格局 。 对 于 
图 灵机 ，6 的 形式 如 下 : QXIT>QXTX{L,R}， 亦 即 ， 若 机 器 处 于 状态 g， 读 写 头 所 在 的 
带子 方 格 内 包含 符号 a， 则 当 d(¢.a=(.b,L) 时 ， 机 器 写 下 符号 5 以 取代 a， 并 进入 状 
态 r。 第 三 个 分 量 L 或 R 指出 在 写 带 之 后 ， 读 写 头 是 向 左 〈(L) CEMA (R) 移动 。 

CEE ERM-i HA (QE, 06d Aaccept reject? HP: Q，5， 古都 是 
RAR, HE 

1].Q 是 状态 集 。 

2. 瑟 是 输入 字母 表 ， 不 包括 特殊 空白 符号 Li。 

SET SCH. 

4.6:QXT>QXIX{L,R} 是 转移 函数 。 

5. go EQ 是 起 始 状态 。 

6. decep 全 Q@ 是 接受 状态 。 

7. drejet EQ ZARS, A gisect ACaccept ° 

图 灵机 M=(Q, E,D, do + Aaccept t Drt) 的 计算 方式 如 下 : 开始 时 ，M 以 最 左边 的 7 
个 带子 方 格 接收 输入 多 二 wivw2…w, E33* ， 带 子 的 其 余部 分 保持 空白 〈 即 填 以 空白 符 )， 
读 写 头 从 最 左边 的 带子 方 格 开始 运行 ,注意 王 不 含 空 白 符 ， 故 出 现在 带子 上 的 第 一 个 空白 
符 表 示 输 入 的 结束 。M 开始 运行 后 ， 计 算 根 据 转 移 函 数 所 描述 的 规则 进行 。 如 果 M 试图 
将 读 写 头 从 带子 的 最 左 端 再 向 左 移出 ， 即 使 转移 函数 指示 的 是 L， 读 写 头 也 停 在 原 地 不 
动 。 计 算 一 直 持 续 到 它 进入 接受 或 拒绝 状态 ， 此 时 停机 。 如 果 二 者 都 不 发 生 ， 则 M 将 永 
远 运 行 下 去 。 

图 灵机 计算 过 程 中 ， 当 前 状态 、 当 前 带子 内 容 和 读 写 头 当 前 位 置 组 合 在 一 起 ， 称 为 图 
灵机 的 格局 〈configuration) ， 常 以 特殊 方式 表示 。 对 于 状态 q 和 带子 字母 表 卫 上 的 两 个 字 
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Ru Alv, U xgv 表示 如 下 格局 : 当前 状态 是 9g， 当前 带子 内 容 是 uv, RS A R AA 
置 是 wv 的 第 一 个 符号 ， 带子 上 wv 的 最 后 一 个 符号 
以 后 的 符号 都 是 空白 符 。 例 如 ，1011g; 01111 表 
示 如 下 格局 : 当前 带子 内 容 是 101101111， 当 前 tToTiTifoTiTiTiliTuTuTuR... 
REE, ROANET MR os ATAR 011g CL MERA 
意 了 处 于 这 个 格局 的 图 灵机 。 

对 图 灵机 计算 方式 进行 形式 化 ， 如 果 图 灵机 能 合法 地 从 格局 Cl 一 步 进 入 Cz ， 则 称 格 
局 Cl 产生 (yields) 格局 C2， 这 个 概念 的 形式 化 定义 如 下 : 

wa, bac Ær PHR, u Mor 中 的 字符 串 ，g; Mag 是 状态 ， 则 uagbv 和 
uq acu 是 两 个 格局 。 如 果 转 移 函 数 满足 6(g; b= Cac L), MiA 

uaq;bv 产生 uq,acv 
这 说 明了 图 灵机 左 移 的 情形 ， 下 面 是 右 移 情形 。 如 果 lq b) =q cR), Mi 
uaq;bv 产生 uacq ;v 

当 读 写 头 处 于 格局 的 两 个 端点 之 一 时 ， 会 发 生 特 殊 变 化 。 对 于 左 端点 ， 如 果 转 移 是 回 
左 移动 ， 则 格局 qi 产生 格局 gjcv 《因为 不 允许 机 器 从 带子 的 最 左 端 移出 ); 如 果 转 移 是 
向 右 移动 ， 这 个 格局 产生 cq;v。 对 于 右 端 点 ， 格 局 uag 等 价 于 wag;U， 因 为 已 假设 : 在 市 
子 上 没有 描述 的 部 分 都 是 空格 。 这 样 ， 就 能 像 以 前 一 样 处 理 了 ， 因 为 此 时 读 写 头 已 不 再 处 
于 带子 的 右 端 点 。 

M 在 输入 w 上 的 起 始 格局 (start configuration) 是 格局 9,w， 表 示 机 器 处 于 起 始 状 态 
gq。， 并 且 读 写 头 处 于 带子 的 最 左 端 位 置 。 在 接受 格局 (accepting configuration) 里 ， 状 态 
是 q,..。s:。 在 拒绝 格局 (rejecting configuration) 里 ， 状 态 是 q,,。。 接 受 和 拒绝 状态 都 是 
停机 格局 (halting configuration)， 它 们 都 不 再 产生 新 的 格局 。 因 为 机 器 只 在 接收 或 拒绝 
状态 下 才 停 机 ， 因 此 可 以 等 价 地 将 转移 函数 记 为 6: Q XT>QXTIX{L,R},， 其 中 Q 是 去 
掉 状 态 accept JAAS gio 的 Q。 图 灵机 M 接受 (accept) 输入 ww， 如 果 存 在 格局 的 序列 
Ci, C2, cr, Cy 使 得 : 

1. C Æ M RA w 上 的 起 始 格 局 ; 

2 Hra ECH: 

3. Cy 是 接受 格局 。 

M 接受 的 字符 串 的 集合 称 为 M 的 语言 (language of M) ， 或 被 M 识别 的 语言 Can- 
guage recognized by M), WX L(M). 

如 果 一 个 语言 能 被 某 一 图 灵机 识别 ， 则 称 该 语言 是 图 灵 可 识别 的 〈Tur- 
ing-recognizable)© 。 l 

在 输入 上 运行 一 个 图 灵机 时 ， 可 能 出 现 三 种 结果 : 接受 、 拒 绝 或 循环 。 这 里 循环 
(loop) 仅仅 指 机 器 不 停机 ， 而 不 一 定 是 这 个 词 的 字面 所 指 的 那样 ， 永 远 以 同样 方式 重复 
同样 的 步骤 。 循 环 动作 可 能 是 简单 的 ， 也 可 能 是 复杂 的 ， 但 都 不 会 导致 停机 状态 。 

对 于 一 个 输入 ， 图 灵机 有 两 种 方式 不 接受 它 : 一 种 是 进入 拒绝 状态 而 拒绝 它 ， 另 一 种 
是 进入 循环 。 有 时 候 ， 很 难 区 分 机 器 是 进入 了 循环 还 是 需要 耗费 长 时 间 的 运行 ， 因 此 ， 我 





O 有些 课 本 称 之 为 递归 可 枚 举 语 言 。 
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们 更 喜欢 对 所 有 输入 都 停机 的 图 灵机 ， 它 们 永 不 循环 ， 称 这 种 机 需 为 判定 器 (decider), 
因为 它们 总 能 决定 是 接受 还 是 拒绝 。 对 于 可 以 识别 某 个 语言 的 判定 器 ， 称 其 判定 (decide) 
该 语言 。 

如 果 一 个 语言 能 被 某 一 图 灵机 判定 ， 则 称 它 是 图 灵 可 判定 的 《Turing de- 
cidable) ， 简 称 可 判定 的 〈decidable)9S 。 

下 面 给 出 一 些 可 判定 语言 的 例子 ， 每 一 个 可 判定 语言 都 是 图 灵 可 识别 的 。 在 第 4 章 ， 
我 们 将 给 出 一 些 图 灵 可 识别 但 不 可 判定 的 语言 例子 。 


3.1.2 图 灵机 的 例子 


像 处 理 有 穷 自 动机 和 下 推 自 动机 那样 ， 为 了 形式 化 地 描述 一 个 特定 图 灵机 ， 可 以 详细 
指明 它 的 七 个 部 分 。 但 除了 最 小 的 机 器 外 ， 这 种 细节 层次 的 描述 对 于 大 多 数 图 灵机 来 说 是 
烦琐 的 ， 所 以 这 里 仅仅 给 出 较 高 层次 的 描述 ， 因 为 这 已 经 足够 精确 ， 并 且 容 易 理 解 得 多 。 
注意 ， 需 要 记 住 ， 每 个 较 高 层次 的 描述 实际 上 只 是 它 的 形式 化 描述 的 一 个 速写 ， 只 要 耐心 
和 细致 ， 总 能 形式 化 地 描述 本 书 中 每 个 图 灵机 的 所 有 细 市 。 

为 帮助 你 在 形式 化 描述 和 较 高 层次 描述 之 间 建 立 联系 ， 在 下 面 两 个 例子 中 给 出 状态 
图 。 如 果 熟 悉 这 样 的 联系 ， 可 以 忽略 这 些 图 。 

描述 图 灵机 Ms ， 它 判定 的 语言 是 所 有 由 0 组 成 、 长 度 为 2 的 方 宕 的 字符 
Ht, BN) A={02 |n>0}., 

M: 二 “对 于 输入 字符 串 w: 

lL 从 左 往 右 扫 描 整 个 带子 ， 隔 一 个 字符 消去 一 个 0。 

2. 如 果 在 第 1 步 之 后 ， 带 子 上 只 剩 下 唯一 的 一 个 0， 则 接受 。 

3. 如 果 在 第 1 步 之 后 ， 带 子 上 包含 不 止 一 个 0， 并 且 0 的 个 数 是 奇数 ， 则 拒绝 。 
4. 读 写 头 返 回 至 带子 的 最 左 并 。 

5. 转 到 第 1 步 。” 

每 重复 一 次 第 1 步 ， 消 去 一 半 个 数 的 0。 由 于 在 第 1 步 中 ， 机 器 扫描 了 整个 带子 ， 故 
它 能 够 知道 它 看 到 的 0 的 个 数 是 奇数 还 是 偶数 。 如 果 是 大 于 1 的 奇数 ， 则 输入 中 所 含 的 0 
的 个 数 不 可 能 是 2 的 方 寡 ， 此 时 机 器 就 拒绝 。 人 但是， 如果 看 到 的 0 的 个 数 是 1， 则 输入 中 
所 含 的 0 的 个 数 肯 定 是 2 的 方 寡 ， 此 时 机 器 就 接受 。 

下 面 给 出 Mz 二 (Q,3, 厂 ,6,g1 ,qaccevt 'qreiect ， 的 形式 化 描述 : 

© Q= 1G) +02 993 994 995 *Vaccept *Treject } ? 

e 5= {0}, 

e T={0,x,U}, 

。 将 6 描述 成 状态 图 〈( 见 图 3-4). 

。 开始 、 接 受 和 拒绝 状态 分 别 是 a) + accept 和 goo o 

在 这 个 状态 图 中 ， 从 gq Hq, 转移 时 出 现 了 标记 OCU, R ERM: ASX q HÈS 
头 读 0 时 ， 机 器 的 状态 变 为 g, ， 在 带子 上 当前 位 置 写 下 U， 并 向 右 移 动 读 写 涉 ， 换 句 话 说 ， 
lq ,0) 二 (gq,,U,R)。 在 从 q, Eg, 的 转移 中 ， 为 清晰 起 见 ， 使 用 了 简略 记 法 OR, ERM: 


O 在 些 课本 称 之 为 递归 语言 。 
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当 机 器 正在 读 0 且 状 态 为 g, 时 ， 向 右 移动 ， 但 不 改变 带子 ， 因 此 8(g, ,0) 一 Cg ,0,R)。 





图 3-4 图 灵机 Ms: 的 状态 图 


发 现 市 子 的 左 疹 点。 一 般 使 用 更 具有 提示 性 的 符号 〈 如 # ) 作为 左 端点 的 定 界 符 ， 但 这 里 
使 用 空白 符 ， 是 为 了 保持 带子 字母 表 的 规模 较 小 ， 从 而 使 状态 图 保持 较 小 规模 。 例 3. 6 给 
出 了 发 现 市 子 的 左 端点 的 为 一 个 方法 。 

我 们 给 出 这 个 机 需 在 输入 0000 上 运行 的 例子 ， 起 始 格局 是 qi0000。 下 面 是 机 器 所 进 


和 的 格局 序列 ， 应 先 从 上 到 下 再 从 左 到 右 地 读 这 个 序列 。 
q, 0000 U q; x0xU U æg, xxU 
LI q, 000 q; U x0x U U q; xxx U 
U xq, 00 Lig, x0xU q; U xxx U 
U x0q, 0 U xq,0xU U q, xxx U 
U x0xq, U U xxq, x U U xq, XX U 
LI x0g. XL LI xxxq, U U xxq, x U 
U xq; 0x U U xxq, x U U xxxq, U 


Uz Li + SESA 


在 本 节 的 开头 ， 已 给 出 了 图 灵机 Mi 的 非 形式 化 描述 ， 下 面 给 出 其 形式 化 描 
述 Mı = (Q525 503059, + Vaccept Irje) BAERE R Æ B={wtw|wEe {0,1}*}. 

© Q= ig a 99g »Faccept *Treject ! ? 

+ D= {0l H) B r={0,1,#,x,}., 

。 FARA AiR è LA 3-5). 

。 开始、 接受 和 拒绝 状态 分 别 是 2). dacot 和 reject o 

图 3- 5 描绘 了 图 灵机 Mi HRSA, HH, Hq, 到 自身 的 转移 ， 你 能 看 到 标记 0， 
1 一 信 ， 它 表示 当 机 器 在 状态 q; 且 读 0 或 1 时 ,保持 状态 g, 不 动 ， 读 写 头 向 右 移动 。 它 不 
改变 带子 上 的 符号 。 

第 1 步 由 状态 q; 到 9 实现 ， 第 2 步 由 其 余 状 态 实现 。 为 简化 状态 图 ， 没 有 在 图 中 显 
示 拒 绝 状态 ， 也 没有 显示 到 拒绝 状态 的 转移 。 这 种 转移 隐 含 地 意味 着 在 下 列 情形 下 发 生 : 

一 个 状态 对 菜 个 特殊 符号 没有 向 外 的 转移 ， 例如 ， 对 于 状态 gq, WAH + Sb 

头 ， 因 此 ， 当 状态 为 g; 且 读 写 头 下 的 符号 为 # 时 ， 就 进入 拒绝 状态 gq.。。.,。 对 于 这 些 转 移 


GBIF LF-ARKHM 109 





图 3-5 图 灵机 Mi 的 状态 图 


函数 ， 如 果 读 写 头 向 右 移 ， 机 器 便 进 入 拒绝 状态 。 = 
图 灵机 Ms 做 一 些 初等 算术 ， 它 判定 语言 C= (abid liXj=k, H ij k>}. 
M; = “Xt FM A SAB w: 
1. 从 左 往 右 扫描 输入 ， 确 认输 入 具有 形式 a+ b+ c+ ， 否 则 拒绝 。 
2. 读 写 头 返回 到 带子 的 左 端点 。 
3. 消去 一 个 a， 并 向 右 扫描 直到 b 出 现 。 在 b 与 c 之 间 来 回 移动 ， 成 对 地 消去 b 
和 c， 直 到 把 所 有 的 b 都 消去 。 如 果 c 已 经 全 被 消去 后 还 有 b， 则 拒绝 。 
4. 如 果 还 有 a 未 消去 ， 则 恢复 所 有 已 消去 的 b， 再 重复 第 3 步 。 如 果 所 有 的 a 都 
已 被 消去 ， 则 检查 所 有 的 c 是 否 都 已 被 消去 。 如 果 是 则 接受 ， 否 则 拒绝 。” 
现在 仔细 检查 Ms 的 四 个 步骤 。 在 第 1 步 ， 机 器 的 运行 就 像 有 穷 自动 机 一 样 ， 当 读 写 
头 从 左 往 右 移动 时 ， 没 有 必要 去 写 ， 只 要 用 它 的 状态 来 跟踪 输入 字符 串 ， 看 其 是 否 具有 适 
当 的 形式 即 可 。 
步骤 2 似 简 实 妙 。 这 个 图 灵机 怎么 才能 找到 输入 带子 的 左 端点 呢 ? 找到 输入 的 右 端点 
是 容易 的 ， 因 为 输入 以 空白 符 终 止 。 但 开始 时 ， 左 端点 并 没有 终止 符 ， 机 器 发 现 其 带子 左 
端点 的 一 种 方法 是 ; 当 读 写 头 从 左 端点 的 符号 开始 运行 时 ， 就 以 某 种 方式 对 这 个 符号 作 个 
标记 ， 这 样 ， 若 机 器 想 要 它 的 读 写 头 回 到 左 端点 时 ， 就 可 以 向 左 扫描 直到 发 现 这 个 记号 。 
例 3.4 说 明了 这 种 方法 ， 它 以 空白 符 作为 带子 左 端点 的 标记 。 
常常 利用 图 灵机 模型 的 定义 中 提供 的 条 件 来 发 现 带子 左 端 点 。 回 忆 一 下 ， 如 果 机 器 试 
图 让 其 读 写 头 移出 带子 的 左 端 点 ， 它 就 待 在 原 地 不 动 ， 可 利用 这 个 特点 来 设置 左 端 点 探测 
器 。 为 了 探测 读 写 头 是 否 正在 左 端点 上 ， 机 器 可 以 在 当前 位 置 写 下 一 个 特殊 符号 ， 同 时 在 
控制 器 中 记 下 它 取 代 的 符号 ， 然 后 试 着 让 读 写 头 向 左 移 。 如 果 它 还 在 这 个 特殊 符号 上 ， 则 
这 次 左 移 没有 成 功 ， 由 此 可 知 ， 读 写 头 肯定 在 左 端点 上 ; 如 果 已 不 在 这 个 特殊 符号 上 ， 而 
在 另 一 个 不 同 的 符号 上 ， 则 带子 上 这 个 位 置 的 左边 肯定 还 有 符号 ， 这 就 完成 了 探测 。 在 进 
一 步 运 行 之 前 ， 必 须 保证 已 将 那个 改变 了 的 符号 还 原 为 原来 的 符号 。 
对 于 第 3、4 步 分 别 使 用 不 同 状态 可 以 直接 实现 它们 ，。 | as 
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图 灵机 Ms 解 所 谓 的 元 素 区 分 问题 (element distinctness problem) 。 给 出 由 
{0，1} 组 成 的 字符 串 系 列 ， 字 符 串 之 间 用 符号 # 隔 开 ，Ma 的 任务 是 : 如 果 此 序列 中 的 所 
有 字符 串 都 不 同 ， 则 接受 。 此 语言 是 

E={#a2,#22#°#2,|2,;€{0,1}* ,B MER iA ziF~z;} 
机 器 Ma 将 zl 与 zz 到 xi ETT ICR, 然后 将 zz 与 zs 到 增进 行 比 较 ， 依 此 类 推 。M4 判定 
这 个 语言 的 非 形式 化 摘 述 如 下 。 
Ma 二 “对 于 输入 Ws 
1. 在 最 左 端 的 带子 符号 的 项 上 做 个 记号 。 如 果 此 带子 符号 是 空 日 符 ， 则 接受 。 
如 果 此 符号 是 # ， 则 进行 下 一 步 。 否 则 ， 拒 绝 。 
2. 向 右 扫描 至 下 一 个 #， 并 在 其 项 上 做 第 二 个 记号 。 如 果 在 遇 到 空白 符 之 前 没 
有 遇 到 # ， 则 融 子 上 只 有 x1， 因 此 接受 。 
3. 通过 来 回 移动 ， 比 较 做 了 记号 的 # 的 右边 的 两 个 字符 串 ， 如 果 它 们 相等 ， 则 
拒绝 。 
4. 将 两 个 记号 中 右边 的 那个 向 右 移 到 下 一 # 上 。 如 果 在 碰 到 空 日 符 之 前 没有 遇 
到 # ， 则 将 左边 的 记号 向 右 移 到 下 一 个 # 上 ， 并 且 将 右边 记号 移 到 后 面 的 间 
上 。 如 果 这 时 右边 记号 还 找 不 到 # ， 则 所 有 的 字符 串 都 已 经 比较 过 了 ， 因 而 
接受 。 
5. 转 到 第 3 步 继 续 执 行 。” 

M: 阐述 了 对 带子 符号 做 标记 的 技术 。 在 第 2 步 ， 它 在 一 个 符号 的 项 上 放置 了 一 个 记 

号 〈 本 例 中 ， 这 个 符号 是 # )。 实 际 上 ， 该 机 器 的 带子 字母 表 中 有 两 个 不 同 的 符号 : # 和 


# 。“ 机 器 在 # 顶 上 放置 了 一 个 记号 “. ”的 含义 是 : 它 将 带 有 点 的 # 写 在 这 个 位 置 。“ 把 
这 个 记号 去 掉 ” 的 含义 是 : 机 器 写 下 了 那个 没有 点 的 符号 # 。 一 般 说 来 ， 可 能 需要 在 各 种 
不 同 的 带子 符号 上 做 记号 ， 要 做 到 这 一 点 ， 只 要 带子 字母 表 中 包含 这 些 符号 的 带 点 形式 即 
可 。 e 

从 以 上 这 些 例子 中 可 以 得 出 如 下 结论 : HRMS A, B, CHE 都 是 可 判定 的 。 由 
于 每 个 可 判定 语言 都 是 图 灵 可 识别 的 ， 所 以 这 些 语言 都 是 图 灵 可 识别 的 。 而 要 说 明 一 个 语 
言 图 灵 可 识别 但 不 可 判定 ， 则 比较 困难 ， 将 在 第 4 章 中 介绍 。 


3.2 图 灵机 的 变形 


其 他 形式 的 图 灵机 还 很 多 ， 例 如 含有 多 个 带子 的 或 非 确 定性 的 图 灵机 ， 它 们 被 称 为 图 
灵机 模型 的 变形 (variant)， 原 来 的 模型 与 它 所 有 合理 的 变形 有 着 同样 的 能 力 ， 也 即 识别 
相同 的 语言 类 。 本 节 将 描述 这 些 变 形 并 证 明 它 们 在 识别 能 力 上 的 等 价 性 。 虽 然 它 们 的 定义 
有 了 变化 ， 但 它们 的 能 力 却 没有 改变 ， 在 形式 变化 中 保持 不 变 的 性 质 称 为 稳健 性 〈robust- 
ness)。 有 穷 自 动机 和 下 推 自动 机 在 某 种 程度 上 都 是 稳健 的 模型 ， 但 图 灵机 更 具 惊 人 的 稳 
健 性 。 

为 说 明 图 灵机 模型 的 稳健 性 ， 先 对 转移 函数 的 形式 在 允许 范围 内 做 小 改动 。 在 原来 的 
定义 中 ， 转 移 函 数 强迫 读 写 头 在 每 一 步 之 后 都 要 向 左 或 向 右 移 动 ， 不 能 仅仅 待 着 不 动 ， 如 
果 人 允许 图 灵机 读 写 头 有 保持 不 动 的 能 力 ， 则 转移 函数 应 有 如 下 的 形式 : 6:QXT>QXTX 
{(L,R,S}。 这 个 特点 能 和 否 使 图 灵机 人 能够 识别 更 多 的 语言 呢 ? 也 即 能 否 增强 它 的 识别 能 力 
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We? 当然 不 能 ， 因 为 我 们 能 将 任何 具有 这 个 特点 的 图 灵机 转变 为 一 个 没有 这 个 特点 的 图 灵 
机 ， 做 法 是 : 用 两 个 转移 替代 每 一 个 “ 待 着 不 动 ” 的 转移 ， 第 一 个 是 向 右 移 动 ， 第 二 个 是 
回 左 返回 。 

这 个 例子 包含 了 证 明 各 种 变形 图 灵机 之 间 等 价 性 的 关键 : 为 证 明 两 个 模型 是 等 价 的 ， 
只 要 证 明 它 们 能 相互 模拟 即 可 。 


3.2.1 多 市 图 灵机 


多 带 图 灵机 (multitape Turing machine) 很 像 普通 图 灵机 ， 只 是 有 多 个 带子 ， 每 个 带 
子 都 有 自己 的 读 写 头 ， 用 于 读 和 写 。 开 始 时 ， 输 入 出 现在 第 一 个 带子 上 ， 其 他 的 带子 都 是 
空白 的 。 转 移 函 数 改 为 允许 多 个 带子 同时 进行 读 、 写 和 移动 读 写 头 ， 其 形式 为 ; 

6:QXI*>QxI* X{(L,R,S}4 
此 处 & 是 带子 的 个 数 。 表 达 式 
00g; 941 9°08 Qe) = (gq; bi ott bes Ly Rye, L) 
指 的 是 ， 若 机 器 处 于 状态 w ， 读 写 头 1 到 下 所 读 的 符号 分 别 是 ai Bar, MOLARE ANR 
Aq, ， 各 读 写 头 分 别 写 下 符号 bi 到 b， 并 按 此 式 所 指示 的 那样 移动 每 个 读 写 头 。 

多 带 图 灵机 看 上 去 比 普通 图 灵机 的 能 力 强 ,但 可 以 证 明 它们 是 等 价 的 。 回 忆 一 下 : 车 
两 个 机 器 识别 相同 的 语言 ， 则 它们 是 等 价 的 。 

每 个 多 带 图 灵机 等 价 于 某 一 个 单 带 图 灵机 。 

证 明 将 一 个 多 带 图 灵机 M 转换 为 一 个 与 之 等 价 的 单 带 图 灵机 S， 关 键 是 怎样 用 S 来 
HHM. 

假设 M 有 个 带子 ，S 把 此 & 个 带子 的 信息 都 存储 在 它 的 唯一 带子 上 ， 并 以 此 来 模拟 
个 带子 的 效果 。 它 用 一 个 新 的 符号 # 作为 定 界 符 ， 以 分 开 不 同 带子 的 内 容 。 除 了 带子 内 容 之 
bh, 还 必须 记录 每 个 读 写 头 的 位 置 。 为 此 ， 它 在 一 个 符号 的 顶 上 加 个 点 ， 以 此 来 标记 读 写 
头 在 其 带子 上 的 位 置 ，S 把 它们 想象 为 虚拟 带子 和 虚拟 读 写 头 。 像 以 前 一 样 ， 加 点 的 带子 符 
号 应 是 已 经 加 进 带子 字母 表 的 新 符号 。 图 3- 6 说 明了 怎样 用 一 个 带子 来 表示 三 个 带子 。 





S 
2 I#|olllolilol#lalalal#|lblal#| ul... 


图 名 -6 用 一 个 带 于 来 表示 三 个 带子 


S= “IIFA w= w wn: 
1. S 在 自己 的 带子 上 放 和 人 


H ww e wn UHUH H 
此 格式 表示 了 M 的 全 部 k 个 带子 的 内 容 。 
2. 为 了 模拟 多 带 机 的 一 步 移动 ，S 在 其 带子 上 从 标记 左 端点 的 第 一 个 # 开 始 扫 
措 ， 一 直 扫 描 到 标记 右 端点 的 第 C+D 个 #， 其 目的 是 确定 虚拟 读 写 头 下 
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的 符号 。 然 后 S 进行 第 二 次 扫描 ， 并 根据 M WFE KRHS R AI IT A E 
ie to 

3. 任何 时 候 ， 只 要 S 将 某 个 虚拟 读 写 头 向 右 移动 到 某 个 # 上 面 ， 就 意味 着 MOF 
自己 相应 的 读 写 头 移动 到 了 其 所 在 的 带子 中 的 空白 区 域 上 ， 即 以 前 没有 读 过 的 
区 域 上 。 因 此 ，S 在 这 个 带子 方 格 上 写 下 空白 符 ， 并 将 这 个 带子 方 格 到 最 右 端 的 
各 个 带子 方 格 中 的 内 容 都 问 右 移动 一 格 。 然 后 再 像 之 前 一 样 继续 模拟 。” 机 

一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 多 带 图 灵机 识别 它 。 
证 明 一 个 图 灵 可 识别 语言 可 由 一 个 普通 的 ( 单 带 ) 图 灵机 识别 ， 这 个 普通 图 灵 
机 是 多 带 图 灵机 的 一 个 特例 ， 这 就 证 明了 此 推论 的 一 个 方向 。 另 一 个 方向 可 由 定理 
3. 8 得 证 。 


3.2.2 非 确定 型 图 灵机 


非 确定 型 图 灵机 有 如 其 名 : 在 计算 过 程 中 ， 机 器 可 以 在 多 种 可 能 性 动作 中 选择 一 种 继 
续 进 行 。 它 的 转移 函数 具有 如 下 形式 ， 

6:QXr—>P(QXITX LR) 
其 计算 是 一 棵 树 ， 不 同 分 支 对 应 着 机 器 不 同 的 可 能 性 动作 。 如 果 计 算 的 某 个 分 支 导致 接受 
状态 ， 则 机 器 接受 该 输入 。 如 果 需 要 复习 非 确定 性 ， 参 看 1. 2 节 ， 现 在 证 明 非 确定 性 不 会 
影响 图 灵机 模型 的 识别 能 力 。 

GERRD 每 个 非 确定 型 图 灵机 都 等 价 于 某 一 个 确定 型 图 灵机 。 

证 明 思路 ”用 确定 型 图 灵机 D 来 模拟 非 确定 型 图 灵机 N 的 证 明 思路 是 : 让 DD 试验 N 
的 非 确 定型 计算 的 所 有 可 能 分 支 。 若 DD 能 在 某 个 分 支 到 达 接 受 状态 ， 则 接受 ， AD 的 
模拟 将 永 不 终止。 

将 N 在 输入 w 上 的 计算 看 作 一 棵 树 ， 树 的 每 个 分 支 代表 非 确定 型 图 灵机 的 一 个 分 支 ， 
结 点 是 N 的 一 个 格局 ， 根 是 起 始 格局 ， 图 灵机 D 在 这 棵 树 上 搜索 接受 格局 。 仔 细 地 引导 
搜索 是 非常 重要 的 ， 以 免 D 不 能 访问 整 棵 树 。 一 个 诱 人 (但 是 坏 ) 的 想法 是 : D 使 用 
“深度 优先 ”策略 搜索 此 树 ， 这 种 搜索 需要 记录 下 其 搜索 的 某 个 分 支 下 的 所 有 子 分 支 ， 然 
后 再 转 去 搜索 另 一 个 分 支 。 如 果 这 样 ，D 有 可 能 要 记录 一 个 无 限 分 支 ， 因 而 要 无 限 记录 下 
去 ， 也 就 不 能 发 现在 其 他 分 支 上 的 接受 格局 。 为 此 我 们 采用 “宽度 优先 ”策略 搜索 整 棵 
树 ， 这 个 策略 是 :在 搜索 一 个 深度 内 的 所 有 分 支 之 后 ， 再 去 搜索 下 一 个 深度 内 的 所 有 分 
支 。 此 方法 能 保证 D 可 以 访问 树 的 所 有 结 点 ， 直 到 它 遇 到 接受 格局 。 

证 明 ”模拟 确定 型 图 灵机 D 有 三 个 带子 ， 根 据 定理 3. 8， 这 等 价 于 只 有 一 个 带子 。 机 
器 D 将 这 三 个 带子 用 于 专门 用 途 。 见 图 3-7。 第 一 个 带子 只 包含 输入 串 ， 且 不 再 改变 ; 第 
二 个 带子 存放 N 的 带子 中 的 内 容 ， 此 内 容 对 应 N 的 非 确定 型 计算 的 某 个 分 支 ; 第 三 个 带 
子 记录 DEN 的 非 确定 型 计算 树 中 的 位 置 。 

首先 考虑 第 三 个 带子 上 表示 的 数据 。 
N 的 每 个 格局 确定 一 个 集合 ， 它 是 由 此 
格局 可 能 转移 到 的 所 有 下 一 格局 组 成 ， 这 
些 下 一 格局 是 由 N 的 转移 函数 指定 的 
N 的 非 确定 型 计算 中 的 每 个 结 点 最 多 有 1 … 地 址 带 


个 子 结 点 ， 其 中 2 是 上 述 集合 中 最 大 的 集 图 3-7 确定 型 图 灵机 DD 模拟 非 确 定型 图 灵机 N 
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合 所 含 的 元 素 个 数 。 对 树 的 每 个 结 点 ， 可 以 给 其 分 配 一 个 地 址 ， 它 是 字母 表 卫 一 人 1,2,，……， 
b) 上 的 一 个 串 。 例 如 ， 把 地 址 231 分 配给 按 以 下 方式 到 达 的 结 点 : 从 根 出 发 走 到 它 的 第 
二 个 子 结 点 ， 再 由 此 走 到 第 三 个 子 结 点 ， 最 后 由 此 走 到 第 一 个 子 结 点 。 此 串 中 的 数字 告 ? 
我 们 : 在 模拟 N 的 非 确定 型 计算 的 一 个 分 支 时 下 一 步 应 做 什么 。 如 果 一 个 格局 拥有 的 选择 
太 少 ， 则 一 个 符号 可 能 不 对 应 任何 选择 ， 此 种 情况 下 ， 地 址 将 无 效 ， 不 对 应 任何 结 点 。 第 三 
个 市 子 上 包含 上 的 一 个 串 ， 它 代表 N 的 计算 树 中 的 如 下 分 支 : 起 点 是 根 ， 终 点 是 此 串 表 
示 的 地 址 所 对 应 的 结 点 ， 除 非 这 个 地 址 是 无 效 的 。 空 串 是 树 根 地 址 。D 的 描述 如 下 : 

1. 开始 时 ， 第 一 个 带子 包含 输入 w， 第 二 和 第 三 个 带子 都 是 空 的 。 

2. 把 第 一 个 带子 复制 到 第 二 个 带子 上 ， 并 将 第 三 个 带子 的 字符 串 初始 化 为 s。 

3. 用 第 二 个 带子 去 模拟 N 在 输入 w 上 的 非 确定 型 计算 的 某 个 分 支 。 在 NN 的 每 一 步 动 
作 之 前 ， 查 询 第 三 个 带子 上 的 下 一 个 数字 ， 以 决定 在 N 的 转移 函数 所 允许 的 选择 中 作 何 
选择 。 如 果 第 三 个 带子 上 没有 符号 剩 下 ， 或 这 个 非 确定 型 的 选择 是 无 效 的 ， 则 放弃 这 个 分 
支 ， 转 到 第 4 步 。 如 果 遇 到 拒绝 格局 也 转 到 第 4 步 。 如 果 遇 到 接受 格局 ， 则 接受 这 个 
输入 。 

4. 在 第 三 个 带子 上 ， 用 字符 串 顺 序 的 下 一 个 串 来 其 代 原 有 的 串 。 转 到 第 2 步 ， 以 模拟 


N 的 计算 的 下 一 个 分 支 。 = 
一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 非 确定 型 图 灵机 识别 它 。 
证 明 确定 型 图 灵机 自然 是 一 个 非 确 定型 图 灵机 ， 此 推论 的 一 个 方向 由 此 立刻 得 证 。 
男 一 个 方 同 可 由 定理 3. 10 得 证 。 z 


可 以 修改 定理 3. 10 的 证 明 ， 使 得 如 果 N 在 计算 的 所 有 分 支 上 都 能 停机 ， 则 D 也 总 能 
停机 。 如 果 对 所 有 输入 所 有 分 支 都 停机 ， 则 称 这 个 非 确定 型 图 灵机 是 一 个 判定 器 (decid- 
er)。 练 习 3. 3 要 求 以 这 种 方式 修改 此 证 明 ， 以 得 到 定理 3. 10 的 下 列 推论 。 

一 个 语言 是 可 判定 的 ， 当 且 仅 当 存 在 非 确定 型 图 灵机 判定 它 。 


3.2.3 lass 


前 面 的 脚注 曾经 提 到 ， 有 人 使 用 术语 递归 可 枚 举 语言 来 代替 图 灵 可 识别 语言 。 这 个 术 
语 起 源 于 称 为 枚 举 器 (enumerator) 的 机 顺 ， 它 是 图 灵机 的 一 种 变形 。 概 略 地 说 ， 枚 举 需 
是 带 有 打印 机 的 图 灵机 ， 图 灵机 把 打印 机 当 作 输出 设备 ， 从 而 可 以 打印 串 。 每 当 图 灵机 想 
在 打印 序列 中 增加 一 个 串 时 ， 就 把 此 串 送 到 打印 机 。 练 习 3.4 要 求 给 出 枚 举 器 的 形式 定 
义 。 图 3-8 给 出 了 这 个 模型 的 示意 图 。 

AA E 以 空白 输入 的 工作 带 开 始 运行 ， 如 
果 不 停机 ， 它 可 能 会 打印 出 串 的 一 个 无 限 序 列 。 
K Ar E 所 枚 举 的 语言 是 最 终 打印 出 的 串 的 集合 ， 
而 且 E 可 能 以 任意 顺序 生成 这 个 语言 中 的 串 ， 其 7 
至 还 会 有 重复 。 下 面 建立 枚 举 器 和 图 灵 可 识别 语 图 3-8 枚 举 器 的 示意 图 
言 间 的 联系 。 

一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 枚 举 器 枚 举 它 。 

证 明 首先 证 明 : MRA REE 枚 举 语 言 A， 则 有 图 灵机 M 识别 A。 图 灵机 M 按 
如 下 方式 运行 : 
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M=“ FRA w: 
1. 运行 五 。 每 当 王 输出 一 个 串 时 ， 将 之 与 三 比 较 。 
2. WR w 曾经 在 五 的 输出 中 出 现 过 ， 则 接受 。” 
显然 ，M 接受 在 E 的 输出 序列 中 出 现 过 的 那些 串 。 
现在 证 明 另 一 个 方向 。 设 ssz,ss,… 是 荆 * 中 的 所 有 可 能 的 串 ， 如 果 图 灵机 M 识别 
语言 A， 则 为 A Mee EEE 如 下 : 
FF 二 “忽略 输入 。 
1. 对 i 二 1,2,3,…， 重 复 下 列 步骤 。 
2. 对 51 ,5s2，… ,si 中 的 每 一 个 ，M 以 其 作为 输入 运行 i H. 
3. 如 果 有 计算 接受 ， 则 打印 出 相应 的 s; 。” 
如 果 M 接受 串 ;s， 它 终 将 出 现在 玉生 成 的 打印 列表 中 。 事 实 上 ， 它 将 在 此 列表 中 出 现 
无 限 多 次 ， 因 为 每 一 次 重复 步骤 1，M 在 每 一 个 串 上 都 从 头 开 始 运行 。 这 个 过 程 有 使 M 在 
所 有 可 能 的 输入 上 并 行 运行 的 效果 。 i 


3.2.4 与 其 他 模型 的 等 价 性 


至 此 ， 已 经 介绍 了 图 灵机 的 多 种 变形 ， 并 证 明了 它们 在 能 力 上 是 等 价 的 。 人 们 还 提出 
了 许多 其 他 的 通用 计算 模型 ， 其 中 的 一 些 与 图 灵机 十 分 相似 ， 而 另 一 些 则 相差 甚 远 ， 但 都 
具有 图 灵机 的 本 质 特征 ， 即 可 以 无 限制 地 访问 无 限 的 存储 器 ， 这 个 特征 把 它们 和 有 穷 自 动 
机 、 下 推 自 动机 等 能 力 较 弱 的 模型 区 别 开 来 。 值 得 注意 的 是 ， 已 经 证 明 : 具有 此 特点 的 所 
有 模型 在 能 力 上 都 是 等 价 的 ， 只 要 它们 满足 一 些 合理 的 必要 条 件 即 可 9 。 

为 理解 这 种 现象 ， 考 虑 程序 设计 语言 中 的 类 似 情 形 。 许 多 程序 设计 语言 (如 Pascal 和 
LISP) 从 类 型 和 结构 上 看 ， 它 们 相去 甚 远 ， 那 么 一 个 算法 是 否 只 能 在 其 中 一 个 上 执行 而 不 
能 在 另 一 个 上 执行 呢 ? 当然 不 是 ， 我 们 既 能 将 LISP 编译 到 Pascal， 也 能 将 Pascal 编译 到 
LISP， 这 意味 着 两 个 语言 描述 了 完全 相同 的 算法 类 ， 其 他 合理 的 程序 设计 语言 也 是 一 样 。 
计算 模型 间 的 普遍 等 价 性 也 基于 完全 同样 的 原因 ， 任 意 两 个 满足 合理 条 件 的 计算 模型 都 能 
相互 模拟 ， 从 而 在 能 力 上 是 等 价 的 。 

这 种 等 价 现象 有 着 重要 的 哲学 内 涵 ， 虽 然 计 算 模 型 是 多 种 多 样 的 ， 但 它们 所 描述 的 算 
法 类 只 有 一 个 。 单 个 计算 模型 的 定义 有 一 定 的 随意 性 ， 但 从 根本 上 说 它 所 描述 的 算法 类 是 
自然 的 ， 因 为 它 和 其 他 模型 所 描述 的 类 是 一 样 的 。 这 种 现象 对 于 数学 也 有 这 远 的 意义 ， 下 
一 节 将 对 此 进行 说 明 。 


3.3 算法 的 定义 


非 形式 化 地 说 ， 算 法 是 为 实现 某 个 任务 而 构造 的 简单 指令 集 。 在 日 常用 语 中 ， 算 法 有 
时 称 为 过 程 或 处 方 。 算 法 在 数学 中 也 起 着 重要 的 作用 ， 古 代数 学 文献 中 包含 了 各 种 各 样 任 
务 的 算法 描述 ， 如 寻找 素数 和 最 大 公 因 子 、 在 当代 数学 中 ， 更 是 充满 了 算法 。 

虽然 算法 在 数学 中 已 有 很 长 的 历史 ， 但 在 20 世纪 之 前 ， 算 法 概念 本 身 一 直 没 有 精确 
的 定义 。 当 时 的 数学 家 对 下 述 问题 只 有 直观 的 认识 : 什么 是 算法 ?在 使 用 和 描述 算法 时 应 
依赖 什么 ”这 种 直观 认识 对 深入 理解 算法 是 不 够 的 。 下 面 的 故事 说 明了 算法 的 精确 定义 对 


日 例如 ,“ 在 一 步 中 只 能 执行 有 限 的 工作 量 ” 就 是 这 样 一 个 条 件 。 
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一 个 重要 数学 问题 是 多 么 的 关键 。 


3.3. 1 和 硕 尔 们 特 问题 


1900 年 ， 数 学 家 希 尔 伯 特 在 巴黎 举行 的 世界 数学 家 大 会 上 发 表 了 至 今 仍然 著名 的 演 
说 。 在 演说 中 ， 他 提出 了 23 个 数学 问题 ， 并 认为 它们 是 对 下 一 个 世纪 的 挑战 ， 其 中 的 第 
10 个 问题 就 是 关于 算法 的 。 

在 描述 这 个 问题 之 前 ， 先 简单 讨论 多 项 式 (polynomial)。 一 个 多 项 式 是 一 些 项 (term) 
的 和 ， 其 中 每 个 项 都 是 一 个 常数 和 一 些 变 元 的 积 ， 常 数 称 为 系数 (coefficient). pila, 

6exrexexryrze z=br? yz? 
是 一 个 项 ， 其 系数 是 6; 又 如 ， 
Gr ye tary — a — 10 
是 一 个 多 项 式 ， 它 有 四 个 项 和 三 个 变 元 zx-、y 和 xz。 本 节 讨 论 中 ， 只 考虑 系数 是 整数 的 多 
项 式 。 多 项 式 的 一 个 根 (root) 是 对 它 的 变 元 的 一 个 赋值 ， 使 得 此 多 项 式 的 值 为 0。 上 述 
多 项 式 的 一 个 根 是 x 二 5，y 二 3 和 z 二 0， 这 个 根 是 个 整数 根 (integral root)， 因 为 所 用 的 
变 元 都 被 赋予 整数 值 。 有 些 多 项 式 有 整数 根 ， 有 些 则 没有 。 

希 尔 伯 特 第 10 问题 由 在 设计 一 个 算法 来 检测 一 个 多 项 式 是 否 有 整数 根 。 他 没有 用 算 
法 这 个 术语 ， 而 是 用 这 样 一 句 短 语 : “通过 有 限 多 次 运算 就 可 以 决定 的 过 程 >82 。 有 意思 的 
是 ， 从 希 尔 伯 特 对 这 个 问题 的 陈述 中 可 以 看 出 ， 他 明确 地 要 求 设计 一 个 算法 ， 因 此 ， 他 明 
显 地 假设 这 样 的 算法 存在 ， 人 们 所 要 做 的 只 是 找到 它 。 

现在 我 们 知道 ， 这 个 任务 没有 算法 ， 它 在 算法 上 是 不 可 解 的 。 但 对 于 那个 时 期 的 数学 
家 来 说 ， 以 他 们 对 算法 的 直观 认识 ， 得 出 这 样 的 结论 是 不 可 能 的 。 这 个 直观 概念 也 许 适 用 
于 给 出 一 些 任务 的 算法 ， 但 在 将 之 用 于 证 明 某 个 特定 任务 的 算法 不 存在 ， 就 毫 无 用 处 了 。 
证 明 算 法 不 存在 需要 给 出 算法 的 明确 的 定义 ， 第 10 问题 的 进展 必须 等 待 这 样 的 定义 。 

在 丘 奇 (Alonzo Church) 和 图 灵 (Alan Turing) 于 1936 年 写 的 文章 中 ， 这 样 的 定义 
终于 被 给 出 。 丘 奇 使 用 称 为 和 -演算 的 记号 系统 来 定义 算法 ， 图 灵 使 用 机 器 来 做 同样 的 事 
情 。 这 两 个 定义 后 来 被 证 明 是 等 价 的 ， 算法 的 非 形式 化 概念 和 精确 定义 之 间 的 这 个 联系 从 
此 被 称 为 丘 奇 -图 灵 论 题 (Church-Turing thesis), WK 3-9 Pra. 


算法 的 直观 概念 等 于 图 灵机 算法 
图 3-9 丘 奇 -图 灵 论 题 


丘 奇 ~ 图 灵 论 题 提出 的 算法 定义 是 解决 希 尔 伯 特 第 10 问题 所 必需 的 。1970 E, BEE 
塞 维 齐 (Yuri Matijasevic) 在 戴 维 斯 (Matin Davis) 、 普 特 纳 姆 (Hilary Putnam) MIP 
# (Julia Robinson) 等 人 工作 的 基础 上 ,证 明了 检查 多 项 式 是 否 有 整数 根 的 算法 是 不 存 
在 的 。 第 4 章 将 介绍 一 种 技术 ， 它 可 以 被 用 来 证 明 这 个 结论 及 证 明 另 外 一 些 问 题 也 是 算法 
上 不 可 解 的 。 

现在 用 上 述 术 语 来 重新 陈述 希 尔 伯 特 第 10 问题 ， 这 样 做 有 助 于 一 些 论题 的 引入 ， 这 
些 论题 将 在 第 4 章 和 第 5 章 中 讨论 。 设 


O 从 德语 原文 翻译 。 
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D=({plp 是 有 整数 根 的 多 项 式 } 
本 质 上 ， 和 希 尔 伯 特 第 10 问题 是 问 : 集合 D 是 不 是 可 判定 的 ? 答案 是 否定 的 。 作 为 比较 ， 
先 证 明 D 是 图 灵 可 识别 的 。 在 证 明之 前 ， 先 讨论 一 个 简单 问题 ， 它 与 希 尔 伯 特 第 10 问题 
非常 类 似 ， 所 不 同 的 是 现在 仅 考 虑 只 有 一 个 变 元 的 多 项 式 ， 如 4r? — 2r? 十 z 一 7。 设 
Di={plp EA BRRN ce 的 多 项 式 } 

下 面 是 识别 Di 的 图 灵机 Mi : 

Mi 一 “输入 是 关于 变 元 z 的 一 个 多 项 式 p. 

1. 4 r MRR EA O, 1, —1, 2, —2, 3, —3, Hf, R p WÉ. —B 
Ri p=0, MHZ.” 

WR p 有 整数 根 ，Mi 最 终 将 找到 它 ， 从 而 接受 ; MR p 没有 整数 根 ， 则 M 将 永远 
运行 下 去 。 对 于 多 个 变 元 的 情形 ， 可 以 设计 一 个 类 似 的 图 灵机 M 来 识别 D， 只 是 M 要 检 
查 多 个 变 元 所 有 可 能 取 的 整数 值 。 

Mi 和 M 都 是 识别 器 而 非 判 定 器 。Mi 可 以 被 转换 成 Di 的 判定 器 ， 因 为 可 以 算出 一 个 
上 界 ， 使 得 一 个 单 变 元 的 所 有 根 都 在 这 个 上 界 内 ， 这 样 ， 只 要 在 这 个 上 界 以 内 进行 搜索 即 
可 。 在 问题 3. 10 中 要 求证 明 : 一 个 多 项 式 的 根 一 定 在 下 列 值 之 间 : 


+ pm 


c] 

其 中 & 是 此 多 项 式 中 项 的 个 数 ，cmax 是 绝对 值 最 大 的 系数 ，cl 是 最 高 次 项 的 系数 。 如 果 在 
这 个 上 界 内 找 不 到 根 ， 则 机 上 需 就 拒绝 。 马 提 亚 塞 维 齐 (Matijasevisc) 定理 表明 : 对 于 多 
变 元 多 项 式 ， 计 算 这 样 的 上 界 是 不 可 能 的 。 


3.3.2 描述 图 灵机 的 术语 


现在 到 了 计算 理论 研究 的 转折 点 。 讨 论 对 象 还 是 图 灵机 ， 但 从 现在 起 ， 真 正 焦 点 是 算 
法 ， 而 图 灵机 只 是 被 用 作 算 法 定义 的 一 个 精确 模型 。 我 们 将 忽略 图 灵机 本 身 的 广博 理论 ， 
也 不 过 多 地 浪费 时 间 在 图 灵机 的 低层 次 程序 设计 上 。 我 们 只 需要 相信 图 灵机 刻画 了 所 有 的 
算法 。 

在 承认 这 一 点 的 前 担 下 ， 下 面 将 图 灵机 算法 的 描述 方式 标准 化 。 在 研究 开始 时 ， 人 们 
总 要 问 : 在 描述 算法 时 ， 什 么 样 的 详细 程度 是 适当 的 ? 学 生 通 常 也 会 问 这 样 的 问题 ， 特 别 
在 他 们 准备 着 手 解 题 和 做 练习 时 更 会 这 样 问 。 描 述 的 详细 程度 有 三 种 : 第 一 种 是 形式 化 描 
述 ， 即 详尽 地 写 出 图 灵机 的 状态 、 转 移 函 数 等 ， 这 是 最 低层 次 、 最 详细 程度 的 描述 ， 第 二 
种 描述 的 抽象 水 平 要 高 一 些 ， 称 为 实现 描述 ， 这 种 方法 使 用 日 常 语言 来 描述 图 灵机 的 动 
作 ， 如 怎么 移动 读 写 头 、 怎 么 在 带子 上 存储 数据 等 ， 这 种 程度 的 描述 没有 给 出 状态 和 转移 
AANA; 第 三 种 是 高 层次 描述 ， 它 也 是 使 用 日 常 语言 来 描述 算法 ， 但 忽略 了 实现 的 细 
节 ， 这 种 程度 的 描述 不 再 需要 提 及 机 器 如 何 管理 它 的 带子 或 读 写 头 。 

本 章 已 经 给 出 了 许多 图 灵机 的 描述 ， 它 们 都 是 形式 化 描述 或 实现 描述 的 例子 。 使 用 较 
低层 次 的 图 灵机 进行 描述 有 助 于 理解 图 灵机 并 增强 使 用 它们 的 信心 ， 一 旦 有 了 这 样 的 信 
心 ， 就 足以 进行 高 层次 描述 。 

下 面 描述 图 灵机 的 格式 和 记号 。 图 灵机 的 输入 总 是 一 个 串 ， 如 果 想 以 一 个 对 象 而 不 是 
字符 串 作 为 输入 ， 必 须 先 将 那个 对 象 字 符 串 化 。 串 能 很 容易 地 表达 多 项 式 、 图 、 文 法 、 自 
动机 及 这 些 对 象 的 任意 组 合 。 可 以 设计 一 个 图 灵机 来 对 这 些 串 进行 适当 的 解码 ， 使 之 被 解 
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释 为 所 希望 的 对 象 。 对 象 O 编码 成 字符 串 的 记号 是 “0，， 如 果 有 多 个 对 象 O ,Os ,… ，,Ox， 
它们 的 编码 是 一 个 串 ， 记 为 《0O1,0O;,…,O:);。 可 用 多 种 合理 的 方式 进行 编码 ， 选 择 哪 一 
种 并 不 重要 ， 因 为 图 灵机 总 能 将 一 种 编码 转化 成 另 一 种 。 
描述 图 灵机 算法 的 格式 是 带 引 号 的 文字 段 ， 且 排 成 锯齿 形状 。 将 算法 分 成 几 个 步骤 ， 
每 个 步骤 可 能 包括 图 灵机 计算 的 许多 步 ， 用 更 深 的 缩 进 方式 来 指示 算法 的 分 块 结 构 。 算 法 
的 第 一 行 描 述 机 器 的 输入 ， 如 果 输 入 描述 仅仅 被 写成 w， 则 这 个 串 就 被 当 作 输入 。 如 果 输 
人 描述 的 是 一 个 对 象 的 编码 ‘A)，， 则 暗示 图 灵机 需要 首先 检查 此 输入 是 否 确实 是 所 要 的 
对 象 的 编码 ， 如 果 不 是 ， 则 拒绝 它 。 
设 A 是 由 表示 连通 无 向 图 的 串 构 成 的 语言 。 回 忆 一 下 ， 如 果 一 个 图 从 任意 
顶点 出 发 都 可 以 沿 着 边 走 到 其 他 所 有 顶点 ， 则 称 这 个 图 是 连通 的 Cconnected), WA 为 
A={(G)|G 是 连通 无 向 图 } 
下 面 是 判定 A 的 图 灵机 M 的 一 个 高 层次 描述 : 
M=“ 输 入 是 图 G 的 编码 (G): 
1. 选择 G 的 第 一 个 顶点 ， 并 标记 之 。 
2. 重复 下 列 步骤 ， 直 到 没有 新 的 顶点 可 作 标 记 。 
3. 对 于 G 的 每 一 个 顶点 ， 如 果 能 通过 一 条 边 将 其 连 到 另 一 个 已 被 标记 的 顶点 ， 
则 标记 该 项 点 。 
4. 扫描 G 的 所 有 顶点 ,确定 它们 是 否 都 已 作 了 标记 。 如 果 是 ， 则 接受 ， 否则 
拒绝 。” 
作为 附加 练习 ， 下 面 检查 图 灵机 M 的 一 些 实 现 细 节 。 今后 一 般 不 给 出 这 些 细 节 ， 也 
没有 必要 这 样 做 ， 除 非 有 这 样 的 明确 要 求 。 首 先 ， 必须 了 解 (G， 是 怎样 将 图 G 编码 成 一 
个 串 的 。 考 虑 如 下 的 编码 方式 : 先是 G 的 顶点 序列 ， 后 面 紧 跟 G 的 边 序列 。 顶 点 由 一 个 
十 进 制 数 表示 ， 边 由 一 对 表示 它 的 两 个 端点 的 十 进 制 数 表 示 。 图 3- 10 描绘 了 这 样 一 个 图 
和 它 的 编码 。 


(G)= (1, 2, 3,4( 2), (2, 3), (3, 1), (1, 4)) 





图 3-10 图 G 和 它 的 编码 (G) 


当 M 收 到 输入 〈“G〉 时 ， 立 即 对 其 进行 检查 ， 以 确定 它 是 否 是 某 个 图 的 正确 编码 。 为 
此 ，M 首先 扫描 市 子 ， 确 定 是 否 有 两 个 序列 ， 并 检查 它们 的 格式 是 否 痢 正确。 第 一 个 序列 
应 该 是 不 相同 的 十 进 制 数 的 序列 ， 第 二 个 序列 应 该 是 十 进 制 数 对 的 序列 。 然 后 M 检查 以 
下 两 项 : 顶点 序列 应 该 不 包含 重复 元 素 ; 出 现在 边 序 列 中 的 每 个 顶点 也 应 该 出 现在 顶点 序 
列 中 。 对 于 前 一 项 ， 可 以 使 用 例 3. 7 给 出 的 图 灵机 Ms 来 检查 元 素 是 否 不 同 ， 并 用 类 似 的 
方法 实现 对 第 二 项 的 检查 。 如 果 输 入 通过 了 这 些 检查 ， 它 就 是 某 个 图 的 编码 。 完 成 了 对 输 
和 的 检查 后 ，M 继续 运行 ， 并 进入 第 1 步 。 

对 于 第 1 步 ，M 在 最 左 端的 数字 上 加 个 点 来 对 第 一 个 顶点 作 标 记 。 
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对 于 第 2 步 ，M 扫描 项 点 序列 以 发 现 一 个 未 加 点 的 顶点 n1， 并 以 男 一 种 方法 对 其 进 
行 标 记 ， 比 如 说 ， 在 它 的 第 一 个 符号 下 画 一 条 线 。 然 后 ，M 再 次 扫描 顶点 序列 来 发 现 一 个 
已 带 点 的 顶点 zz， 并 在 其 下 划 线 。 

然后 M 扫描 边 序列 。 对 于 每 一 个 边 ，M 检查 那 两 个 带 下 划 线 的 顶点 za; Am, ARE 
否 在 这 条 边 中 出 现 。 如 果 是 ， 则 M 在 n1 上 加 点 ， 并 去 掉 其 下 划 线 ， 再 回 到 第 2 步 的 开头 ， 
然后 继续 和 运行。 如 果 不 是 ， 则 M 检查 边 序列 中 的 下 一 个 边 ， 如 果 没 有 多 余 的 边 ， 则 {ni， 
n) 不 是 G 的 边 。 然 后 它 把 ns 下划线 移动 到 下 一 个 带 点 的 项 点 上 ， 现 在 称 这 个 顶点 为 n2。 
再 重复 本 段 中 的 步骤 ， 并 像 以 前 一 样 检查 这 个 新 的 对 {nm ,ns) 是 否 是 一 条 边 。 如 果 已 没 
有 多 余 的 带 点 的 项 点 ， 则 nm 就 没有 被 连 到 任何 带 点 的 顶点 上 。 然 后 M 重新 设置 下 划 线 ， 
使 得 m 是 下 一 个 不 带 点 的 项 点 ，nz 是 第 一 个 带 点 的 项 点， 重复 本 段 中 的 步骤 。 如 果 还 没 
有 多 余 的 不 带 点 的 顶点 ， 则 M 未 能 发 现任 何 新 的 顶点 可 以 加 点 ， 故 转 人 第 4 步 。 

对 于 第 4 步 ，M 扫描 顶点 序列 ， 检 查 是 否 都 已 被 加 点 。 如 果 是 ， 则 进入 接受 状态 ， 否 


则 进入 拒绝 状态 。 这 就 完成 了 图 灵机 M 的 描述 。 ie 
练习 
3.1 此 练习 与 图 灵机 Ms 有 关 ， 例 3.4 给 出 了 它 的 描述 及 状态 图 。 在 下 列 每 个 输入 串 上 ， 给 出 M: 所 
进入 的 格局 序列 : 
a. 0 Ab. 00 c. 000 d. 000000 
3.2 此 练习 与 图 灵机 M 有 关 ， 例 3.5 给 出 了 它 的 描述 及 状态 图 。 在 下 列 每 个 输入 串 上 ， 给 出 Mi 所 
进入 的 格局 序列 : 
Ag. 11 b.1#1 c1# #1 d. 10#11 
e. 10410 


^3.3 修改 定理 3.10 以 得 到 推论 3.12 的 证 明 ， 即 证 明 一 个 语言 是 可 判定 的 当 且 仅 当 有 非 确 定型 图 灵机 
判定 它 。( 可 以 假设 关于 树 的 下 列 定理 成 立 : 如 果 一 棵 树 中 的 每 个 结 点 只 有 有 限 多 个 子 结 点 ， 且 
此 树 的 每 一 个 分 支 只 有 有 限 多 个 结 点 ， 则 此 树 本 身 只 有 有 限 多 个 结 点 。) 
3.4 给 出 枚 举 器 的 一 个 形式 化 定义 。 可 将 其 看 作 一 种 双 带 图 灵机 ， 用 它 的 第 二 个 带子 作为 打印 机 。 包 
括 它 所 枚 举 的 语言 的 定义 。 
A3.5 检查 图 灵机 的 形式 化 定义 ， 回 答 下 列 问 题 并 解释 你 的 推理 : 
a 图 灵机 能 在 它 的 带子 上 写 下 空白 符 吗 ? 
b. 带子 字母 表 卫 和 输入 字母 表 卫 能 相同 吗 ? 
c. 图 灵机 的 读 写 头 能 在 连续 的 两 步 中 处 于 同一 个 位 置 吗 ? 
d. 图 灵机 能 只 包含 一 个 状态 吗 ? 
3.6 定理 3.13 证 明了 一 个 语言 是 图 灵 可 识别 的 当 且 仅 当 有 枚 举 器 枚 举 它 。 为 什么 不 能 用 下 列 更 简单 的 
算法 作为 充分 性 的 证 明 ? 像 以 前 一 样 ，s1 ,ss，… 是 5* 中 的 所 有 串 。 
E= “ARA, 
1. 对 于 i 二 1,2,3,… ,重复 下 列 步骤 。 
2. 在 Si 上 运行 M 。 
3. 如 果 接 受 ， 则 打印 出 sio” 
3.7 下 面 描述 的 不 是 一 个 合法 的 图 灵机 ， 解 释 为 什么 。 
Mra = “FEMA (p>) 上， 其 中 p 为 变 元 zx1,… ,zs 上 的 一 个 多 项 式 : 
1. tka, «+, ce 取 所 有 可 能 的 整数 值 。 
2. 对 所 有 这 些 取 值 求 p 的 值 。 


3.8 


问题 


“3.9 


3.10 


*3. 11 
*3.12 
"2. 13 
“3. 14 


3. 19 
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3. 只 要 某 个 取 值 使 得 p AO, WHS, 否则 拒绝 。” 
下 面 的 语言 都 是 字母 表 (0.1) 上 的 语言 ， 以 实现 层次 的 描述 给 出 判定 这 些 语言 的 图 灵机 : 
‘a. {w|w 包 含 相 同 个 数 的 0 和 1}. 
b. (w| w 所 包含 的 0 的 个 数 是 1 的 个 数 的 两 倍 } 。 
c. (w w 所 包含 的 0 的 个 数 不 是 1 的 个 数 的 两 倍 } 。 


设 A 是 仅 含 一 个 串 * 的 语言 ， 其 中 : 
(0 如 果 火 星 上 没有 任何 生命 
O ll 如 果 火 星 上 发 现 生命 
A 是 可 判定 的 吗 ? 为 什么 ”在 本 题 中 ,假设 “火星 上 是 否 有 生命 ”这 一 问题 的 答案 只 有 “有 ” 
或 “没有 ”两 种 。 
BWA arter tet car ter AR = 209 Cmaxte co 的 最 大 绝对 值 。 证 明 


zo | (Cnt 1) Te 


证 明 : 不 能 在 带子 的 输入 区 域 写 的 单 带 图 灵机 只 能 识别 正则 语言 。 

证 明 每 一 个 无 穷 图 灵 可 识别 语言 都 有 一 个 无 穷 可 判定 子 集 。 

证 明 : 一 个 语言 是 可 判定 的 ， 当 且 仅 当 有 枚 举 器 以 标准 字符 串 顺 序 枚 举 这 个 语言 。 

设 图 灵 可 识别 语言 B={(M,).(M2).-+} 由 图 灵机 的 描述 组 成 ， 证 明 存 在 一 个 以 图 灵机 作为 输 
人 字符 的 图 灵 可 识别 语言 C， 使 得 在 B 中 的 每 一 个 图 灵机 在 C 中 也 有 一 个 图 灵机 与 之 等 价 ， 反 
之 亦 然 。 

证 明 图 灵 可 识别 语言 类 在 下 列 运 算 下 封闭 : 


Aa. 并 b. 连接 c. BE d. 交 e 同 态 
证 明 可 判定 语言 类 在 下 列 运算 下 封闭 : 
Aa. 并 b. 连接 c 星 号 d. 补 e. 交 


只 写 一 次 图 灵机 (write-once Turing machine) 是 一 个 单 带 图 灵机 ， 它 在 每 个 带子 方 格 上 最 多 只 
能 改变 其 内 容 一 次 ( 包 插 带子 上 的 输入 区 )。 证 明 图 灵机 模型 的 这 个 变形 等 价 于 普通 的 图 灵机 模 
型 。( 提 示 : 首先 考虑 如 下 图 灵机 : 可 以 修改 带子 方 格 最 多 两 次 ， 使 用 多 个 带子 .) 
双 无 限 带 图 灵机 (Turing machine with doubly infinite tape) 与 普通 图 灵机 相似 ， 所 不 同 的 是 它 的 
带子 向 左 和 向 右 都 是 无 限 的 。 此 带子 在 开始 时 ， 除 了 包括 输入 区 域外 ， 其 他 都 填 以 空白 符 ， 计 
算 也 像 通常 一 样 定义 ， 只 是 在 它 回 左 移动 时 不 会 遇 到 带子 的 端点 。 证 明 这 种 类 型 的 图 灵机 识别 
图 灵 可 识别 语言 类 。 
左 复位 图 灵机 (Turing machine with left reset) 和 普通 图 灵机 类 似 ， 只 是 它 的 转移 图 数 具 有 下 列 
形式 : 

QXT = QXTX {RRESET) 
如 果 6(Cq,a) 王 (r,b,RESET)， 则 当 机 器 处 于 状态 g 且 读 a 时 ,在 带子 上 写 下 5 并 进入 状态 r 后 ， 
读 写 头 就 跳 到 带子 的 左 端点 。 注 意 ， 这 样 的 机 器 没有 将 它 的 读 写 头 向 左 移动 一 个 符号 的 普通 能 
力 。 证 明 左 复位 图 灵机 识别 图 灵 可 识别 语言 类 。 
以 停留 代替 左 移 图 灵机 (Turing machine with stay put instead of left) 和 普通 图 灵机 类 似 ， 只 是 
它 的 转移 函数 具有 下 列 形 式 : 

XKP > QXrx{R,S$} 

在 任何 时 候 ， 机 器 可 以 将 读 写 头 向 右 移 ， 或 让 其 停留 在 原 地 不 动 。 证 明 这 样 的 图 灵机 与 普通 图 
灵机 不 等 价 ， 这 样 的 图 灵机 识别 什么 语言 类 ? 
队列 自动 机 Cqueue automaton) 类 似 于 下 推 自动 机 ， 只 是 栈 换 成 了 队列 ， 队 列 是 只 能 从 左边 写 
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入 符号 从 右边 读 出 的 带子 ， 每 次 写 操作 GED 往 队 列 的 左 端 增 加 一 个 字符 ， 每 次 读 操作 G) 从 
队列 的 右 端 读 取 一 个 字符 并 随即 将 其 从 带子 上 删除 。 和 下 推 自动 机 一 样 ， 队 列 自 动机 的 输入 被 
放 在 一 条 单独 的 只 读 输入 带 上 ， 且 读 写 头 只 能 在 输入 带 上 从 左 向 右 移动 ， 输 入 带 在 输入 字符 串 
后 跟 一 空白 字符 以 标识 输入 的 结束 人 位置。 队列 自动 机 在 对 输入 进行 操作 的 过 程 中 ， 只 要 进入 一 
个 接受 状态 ， 机 器 就 接受 。 证 明 一 个 语言 能 被 一 个 确定 型 队列 自动 机 识别 当 且 仅 当 该 语言 是 图 
灵 可 识别 的 。 

3.22 WRPDA 表示 有 kk 个 栈 的 下 推 自动 机 。 因 此 ，0-PDA 就 是 一 个 NFA, 1-PDA 就 是 通常 的 PDA. 
已 经 知道 1-PDA H 0-PDA 更 强 (识别 更 大 的 语言 类 )，。 
a. 证 明 2-PDA 比 1-PDA 更 强 。 
b. 证 明 3-PDA 不 比 2-PDA 更 强 。 
(提示 : 用 两 个 栈 来 模拟 一 个 图 灵机 带 。) 

习题 选 解 

3.1 b.g,00, Ug,0, O xg; OU, Lig;xL, gs UxU, Ug xl, U xg, L，DxHaqseeen 


3.2 


3.3 


3.8 


3.9 


3.15 


a. gill, xq,1, xlg,U, xlUgq,.4¢ 
证 明 推 论 的 两 个 方向 。 首 先 ， 如 果 语 言 世 是 可 判定 的 ， 则 它 能 被 一 个 确定 型 图 灵机 判定 ， 而 确定 
型 图 灵机 自然 是 一 个 非 确 定型 图 灵机 。 其 次 ， 如 果 语 言 工 能 被 一 个 非 确 定型 图 灵机 N 所 判定 ， 那 
么 按 如 下 步骤 修改 定理 3. 10 的 证 明 中 给 出 的 确定 型 图 灵机 D。 将 步骤 4 移 到 步骤 5。 增 加 新 的 步 
PRA: WR 六 的 所 有 非 确 定性 的 分 支 都 被 拒绝 ， 则 拒绝 。 
现在 讨论 新 的 图 灵机 DEL 的 判定 器 。 如 果 N 接受 它 的 输入 ，D' 也 最 终 会 找到 一 个 接受 分 支 并 
接受 。 如 果 N 拒绝 它 的 输入 ， 则 它 的 所 有 分 支 将 因 其 为 判定 器 而 停止 并 拒绝 。 因 此 ， 每 个 分 支 有 
有 限 个 结 点 ， 每 个 结 点 代表 N 的 一 步 计 算 。 所 以 根据 前 面 练习 给 出 的 关于 树 的 描述 可 知 ，N 在 一 
个 输入 上 的 完整 计算 树 是 有 限 的 。 从 而 ， 当 这 棵 树 遍 历 完 后 D 将 停止 并 拒绝 。 
a 是 。 带 子 字母 表 丁 包括 LU， 图 灵机 能 在 带子 上 写 下 卫 中 的 任何 字符 。 
b. FE. SAPTE U, 但 栈 总 是 包括 U。 因 此 它们 不 能 相等 。 
. 是 。 若 图 灵机 试图 从 带子 的 左 端点 向 左 移动 读 写 头 ， 则 读 写 头 保 持原 来 位 置 不 变 。 
. 不 是 。 任 何 图 灵机 必须 包括 两 个 可 区 分 的 状态 qseee 和 qusee， 因 此 ， 一 个 图 灵机 至 少 包括 两 个 
状态 。 
a. “XTRA w: 
1. 扫描 带子 并 对 第 一 个 未 标记 的 0 进行 标记 。 如 果 没 有 发 现 未 被 标记 的 0， 则 转 到 第 4 步 ， 否 
则 ， 读 写 头 返回 至 带子 的 左 端点 。 
2. 扫描 带子 并 对 第 一 个 未 标记 的 1 进行 标记 。 如 果 没 有 发 现 未 被 标记 的 1， 则 拒绝 。 
3. 读 写 头 返 回 至 带子 左 端点 ， 并 转 到 第 1 步 继续 执行 。 
4. 读 写 头 返 回 至 带子 左 端点 ， 扫 描 带 子 以 发 现 是 否 存 在 未 被 标记 的 1。 如 果 没 有 则 接受 ， 否则 
拒绝 。” 
语言 A 是 语言 (0) 或 语言 (1) 之 一 ， 这 两 个 语言 都 是 有 穷 的 ， 因 此 是 可 判定 的 。 如 果 不 能 判定 
上 述 两 个 语言 哪 一 个 是 A， 也 就 不 能 描述 出 A 的 判定 器 。 但 是 ， 可 以 给 出 两 个 图 灵机 ， 其 中 必 有 
一 个 是 A 的 判定 器 。 
a. 对 任意 两 个 图 灵 可 识别 语言 Li. Le 及 其 对 应 的 图 灵 识 别 机 M, M, HERRE MWS Li 
5 L WHR. 
“对 于 输入 w: 
1. 逐步 地 在 w 上 交替 地 运行 Mi 和 M2z 。 任 何 一 个 接受 ， 则 M 接受 。 如 果 两 个 机 器 都 停机 
并 拒绝 ， 则 M 拒绝 。” 


Qa Oo 


PIÈ LF-HRKCM 121 


如 果 M 或 M: 接受 w， 则 因为 接受 图 灵机 在 有 限 步 达到 接受 状态 ， 从 而 M 也 接受 w。 注 意 : 
如 果 Mi. M: 都 拒绝 或 者 任何 一 个 处 于 循环 状态 ， 则 M 将 一 直 循 环 下 去 。 
3.16 a 对 于 任意 两 个 可 判定 语言 Li ML, HARIM AM, 分 别 判定 它们 。 构 造 图 灵机 M 来 判定 
a Li 和 Le 的 并 集 : 
“对 于 输入 w: 
1. 在 ww 上 运行 Mi。 如 果 它 接受 ， 则 接受 。 
2. 在 ww 上 运行 M;。 如 果 它 接受 ， 则 接受 ， 否 则 拒绝 。” 
如 果 Mi R M: 接受 w， 则 M 接受 w。 如 果 二 者 都 拒绝 ， 则 M 拒绝 。 
3.17 首先 用 一 个 两 次 写 图 灵机 模拟 一 个 普通 图 灵机 。 两 次 写 图 灵机 将 整个 带子 的 字符 串 内 容 拷贝 到 带 
子 右边 的 空白 部 分 〈 也 即 在 带子 上 第 一 个 空白 字符 处 开始 对 带子 上 的 字符 串 进 行 拷贝 )， 来 模拟 原 
来 机 器 的 一 步 操 作 。 机 器 逐 字 符 拷贝 并 对 其 进行 标记 ， 这 个 过 程 会 对 每 个 带子 方 格 进行 两 次 操作 。 
第 一 次 写字 符 ， 第 二 次 紧 接 着 对 这 个 字符 进行 标记 ， 以 标识 其 已 经 被 拷贝 。 原 来 图 灵机 的 读 写 头 
位 置 在 带子 上 进行 标记 ， 当 把 方 格 中 的 内 容 拷贝 到 这 个 位 置 或 者 其 旁边 时 ， 带 子 的 内 容 根据 原来 
图 灵机 的 规则 进行 更 新 。 
用 一 次 写 图 灵机 进行 模拟 时 ， 其 操作 同 两 次 写 图 灵机 ， 只 是 原来 带子 上 的 每 个 方 格 现在 用 两 
个 方 格 表示 ， 第 一 个 存储 原来 带子 上 的 符号 ， 第 二 个 存储 在 拷贝 过 程 中 做 上 标记 的 字符 。 输 入 不 
能 用 两 个 格子 代表 一 个 字符 ， 因 此 ， 在 第 一 次 带子 被 拷贝 时 ， 就 直接 在 输入 字符 上 进行 标记 。 


第 4 章 | 


Introduction to the Theory of Computation, 3e 


可 判定 性 





第 3 章 引 入 了 图 灵机 作为 通用 计算 机 模型 ， 并 根据 丘 奇 -图 灵 论 题 ， 用 图 灵机 定义 了 
算法 概念 。 

本 章 开 始 人 研究 算法 求解 问题 的 能 力 。 我 们 将 证 明 ， 有 些 问题 算法 上 能 够 求解 ， 但 另 一 
些 则 不 能 。 本 章 旨 在 研究 算法 可 解 性 的 局 限 。 也 许 不 少 人 对 算法 可 解 性 已 知之 甚 多 ， 因 为 
计算 机 科学 的 绝 大 部 分 是 研究 可 求解 问题 的 。 但 这 一 章 里 断言 有 些 问题 是 不 可 解 的 ， 这 可 
能 会 让 人 感到 意外 。 

通常 ， 人 们 追求 问题 的 答案 ， 而 在 此 时 试图 证 明 该 问题 的 不 可 解 性 似乎 没有 什么 用 
处 。 但 是 研究 不 可 解 性 的 理由 有 二 : 第 一 ， 知 道 问 题 在 算法 上 是 不 可 解 的 ， 就 不 必 浪 费力 
量 去 寻找 不 存在 的 解法 ， 进 而 可 以 把 精力 花 在 改变 或 简化 问题 ， 以 便 找 到 简化 问题 的 算法 
解 上 。 像 任何 工具 一 样 ， 计 算 机 也 有 能 力 上 的 局 限 。 要 想 很 好 地 使 用 计算 机 ， 必 须 正 确 地 
认识 它 的 能 力 和 局 限 。 第 二 ， 能 锻炼 人 的 能 力 ， 即 使 你 处 理 的 问题 都 是 可 解 的 ， 了 解 不 可 
解 性 也 能 激发 你 的 想象 ， 并 帮助 你 全 面 而 透彻 地 理解 什么 是 计算 。 


4.1 可 判定 语言 

本 市 将 给 出 一 些 算法 上 可 判定 的 语言 的 例子 。 我 们 将 关注 涉及 自动 机 和 文法 的 语言 。 
例如 ， 提 出 一 个 算法 来 检测 一 个 串 是 否 是 一 个 上 下 文 无 关 语 言 (context-free language, 
CFL) 中 的 元 素 。 关 注 这 些 语 言 是 有 趣 的 ， 因 为 : 首先 ， 某 些 问题 是 和 应 用 相关 的 。 例 如 
测试 一 个 上 下 文 无 天 文法 是 否 可 生成 某 一 个 串 ， 这 一 问题 就 和 程序 设计 语言 中 的 程序 识别 
及 编译 有 关 。 此 外 ， 某 些 涉及 上 自动 机 和 文法 的 问题 在 算法 上 却 是 不 可 判定 的 。 开 始 举 的 例 
子 很 可 能 是 可 判定 的 ， 而 这 或 许 有 助 于 你 领会 一 些 不 可 判定 的 例子 。 


4.1.1 与 正则 语言 相关 的 可 判定 性 问题 


首先 介绍 与 有 穷 自 动机 有 关 的 计算 问题 。 我 们 将 给 出 算法 来 检测 一 个 有 穷 自动 机 是 否 
接受 一 个 串 、 一 个 有 穷 自动 机 的 语言 是 否 为 空 以 及 两 个 有 穷 自动 机 是 否 等 价 等 问题 。 

因为 已 经 建立 了 处 理 语言 的 术语 ， 故 为 方便 起 见 ， 就 用 语言 来 表示 各 种 计算 问题 。 例 
如 DFA 接受 问题 (acceptance problem)， 检 测 一 个 特定 的 确定 型 有 穷 自动 机 是 否 接受 一 个 
事先 给 定 的 串 ， 此 问题 可 表示 为 语言 Appa» EMA TA DFA 的 编码 以 及 DFA 接受 的 
串 的 编码 。 令 

Apra ={(B,w)|B 是 DFA 并且 接 受 输 入 串 w) 

问题 “DFA B 是 否 接受 输入 w” 与 问题 “〈(B,w〉 是 否 是 Apra 的 元 素 ” 是 相同 的 。 类 
似 地 ， 其 他 一 些 计算 问题 也 可 表示 成 检查 语言 的 成 员 隶 属 关系 ， 证 明 这 个 语言 是 可 判定 的 
与 证 明 这 个 计算 问题 是 可 判定 的 是 同一 回 事 。 

下 面 的 定理 将 证 明 ApfA 是 可 判定 的 ， 因 而 也 就 证 明了 问题 “一 个 给 定 的 有 穷 自动 机 
是 否 接受 一 个 给 定 的 串 ” 是 可 判定 的 。 
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AnpFA 是 一 个 可 判定 语言 。 

证 明 思 路 证 明 思 路 非常 简单 。 只 要 设计 一 个 判定 ApfA 的 图 灵机 M 即 可 。 

M= “HFAA (Bow), # BEDFA, we: 

1. 在 输入 w 上 模拟 B。 
2. 如 果 模 拟 以 接受 状态 结束 ， 则 接受 ; 如 果 以 非 接受 状态 结束 ， 则 拒绝 。” 

证 明 我 们 仅 提 及 证 明 中 的 某 些 实现 细节 。 如 果 你 对 某 个 标准 程序 设计 语言 很 熟悉 ， 
那 就 想 一 想 ， 怎 样 写 一 个 程序 来 执行 这 个 模拟 。 

首先 检查 输入 〈B,w)， 它 表示 输入 串 w 和 DFA B. 的 一 个 合理 的 表示 方法 是 简单 
地 列 出 它 的 五 个 元 素 Q、53.、6、g。 及 下 。 当 M 收 到 输入 时 ， 首 先 检查 它 是 否 正确 地 表示 了 
DFA B 和 串 w。 如 果 不 是 ， 则 拒绝 。 

然后 M 直接 执行 模拟 。 用 在 带子 上 写 下 信息 的 方法 ， 它 可 以 记录 BEWA w 上 运行 
时 的 当前 状态 和 当前 位 置 。 运 行 开始 时 ，B 的 当前 状态 是 gq,。， 读 写 头 的 当前 位 置 是 ww 的 
最 左 端 符号 。 状 态 和 位 置 的 更 新 是 由 转移 函数 8 决定 的 。 当 M 处 理 完 w 的 最 后 一 个 符号 
时 ， 如 果 B 处 于 接受 状态 ， 则 M 接受 这 个 输入 ; 如果 不 是 ， 则 M 拒绝 。 z 

对 非 确定 型 有 穷 自动 机 ， 可 以 证 明 类 似 的 定理 。 设 

Anra={(B,w)|B Æ NFA 并 且 接 受 输 入 串 w) 

ANFA 是 一 个 可 判定 语言 。 

证 明 构造 一 个 判定 ANFA 的 图 灵机 N。 可 以 将 N 设计 成 与 M 一 样 ， 只 是 将 模拟 
DFA 改 为 模拟 NFA。 但 我 们 不 这 样 做 。 下 面 说 明 一 个 新 想法 : 用 M 作为 N 的 子 程序 。 
因为 M 被 设计 成 只 接收 DFA 作为 输入 ， 故 NN 先 将 作为 输入 所 收 到 的 NFA 转换 成 DFA, 
然后 再 将 它 传 给 M。 

N= “FHA (Bow), HP B Æ NFA, we: 

1. 用 定理 1.19 所 给 的 转换 过 程 将 NFA B 转换 成 一 个 等 价 的 DFA C. 
2. ÆA (C, w) 上 像 定 理 4. 1 那样 运行 图 灵机 M. 
3. WR M 接受 ， 则 接受 ， 否 则 拒绝 。” 
第 2 步 中 ,“ 运 行 图 灵机 M” 的 含义 是 : 将 M 作为 一 个 子 程序 加 进 N 的 设计 中 。 m 
可 以 类 似 地 测定 一 个 正则 表达 式 是 否 派 生 一 个 给 定 的 串 。 设 
Arcx 二 4《R,w)|R 是 正则 表达 式 ,w 是 串 ,R 派生 www) 

Arx -ATH E. 

证 明 下 面 的 图 灵机 P 判定 ArEx。 

P=“fEm A (Row) E, KP R 是 正则 表达 式 ，w EF: 

1. 用 定理 1. 28 所 给 的 转换 过 程 将 正则 表达 式 R 转换 成 一 个 与 之 等 价 的 NFA A, 
2. 在 输入 《A,w〉 上 运行 图 灵机 N. 
3. 如 果 N 接受 ， 则 接受 ; 如 果 N 拒绝， 则 拒绝 。” = 

EH 4.1, 4.2 和 4.3 说明， 对 于 可 判定 性 , H DFA, NFA 或 正则 表达 式 表 达 图 灵机 
都 是 等 价 的 ， 因 为 图 灵机 能 将 它们 的 编码 进行 互相 转换 。 

现在 转向 与 有 穷 自 动机 有 关 的 男 一 种 问题 ， 有 穷 自 动机 语言 的 空 性 质 测试 。 在 以 前 的 
定理 中 ， 和 常常 必须 检查 一 个 有 穷 自动 机 是 否 接 受 一 个 特定 的 串 。 在 下 面 的 证 明 中 ， 要 检查 
一 个 有 穷 自动 机 是 否 根 本 不 接受 任何 串 。 令 
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Epa = (A) |A -A DFA, H LIA) SØ} 

Epra %.— 4 FT F] £78 = 

证 明 DFA 接受 一 个 串 当 且 仅 当 : 从 起 始 状态 出 发 ， 沿 着 此 DFA 的 箭头 方向 ， 能 够 
到 达 一 个 接受 状态 。 为 检查 这 个 条 件 ， 设 计 一 个 使 用 标记 算法 的 图 灵机 工 ， 此 算法 已 在 例 . 
3. 14 中 使 用 过 。 

T=“ FA (A), Hp A 是 一 个 DFA. 

1. 标记 A 的 起 始 状 态 。 

2. 重复 下 列 步骤 ， 直 到 所 有 状态 都 被 标记 。 

3. 对 于 一 个 状态 ， 如 果 有 一 个 到 达 它 的 转移 是 从 某 个 已 经 标记 过 的 状态 出 发 的 ， 
则 将 其 标记 。 

4. 如 果 没 有 接受 状态 被 标记 ， 则 接受 ， 和 否则 拒绝 。?” # 

下 一 个 定理 证 明 : 检查 两 个 DFA 是 否 识 别 同 一 个 语言 是 可 判定 的 。 设 

FEQDbRA 一 {((A,B)|A 和 也 都 是 DEFA, 且 工 (A) 王 二 (了 7)} 

EQpFA 是 一 个 可 判定 语言 。 

证 明 用 定理 4.4 来 证 明 本 定理 。 下 面 由 A 和 B 来 构造 一 个 新 的 DFA C， 使 得 C 只 
接受 这 样 的 串 : A 或 B 接受 但 不 是 都 接受 。 这 样 如 果 A 和 B 识别 相同 的 语言 ， 则 C 不 接 
受 任何 串 。C 的 语言 

LOO) =(LCAI NEB YU (TAD TL BS 

此 处 L(A) 是 L(A) 的 补 集 ， 这 个 表达 式 称 为 L(A) 和 工 (B) 的 对 称 差 (symmetric 
difference)， 见 图 4-1。 这 里 ， 对 称 差 是 有 用 的 ， 因 为 
LIDO=S 4AM L(A=L(B)., 已 部 证 明正 则 话 言 L(A) L(B) 
在 补 、 并 和 交 下 是 封闭 的 。 这 些 证 明 所 使 用 的 构造 可 以 用 å 
来 构造 C。 这 些 构造 都 是 算法 ， 可 以 由 图 灵机 来 执行 。 一 
且 完 成 了 C 的 构造 ， 就 可 用 定理 4.4 来 检查 工 (C) BAW 
空 。 如 果 它 是 空 的 ，L(A) 与 工 (B) 必定 相等 。 

F 二 “对 于 输入 (A,B), HF A MB 都 是 DFA， 

1. 如 上 描述 的 那样 构造 DFA C, 
2. ÆA (C) 上 运行 定理 4.4 中 的 图 灵机 T. 
3. WR TÈZ, Mg; 如 果 工 拒绝 ， 则 拒绝 。” a 


4.1.2 与 上 下 文 无 关 语 言 相关 的 可 判定 性 问题 


下 面 描述 两 个 算法 ， 一 个 检查 某 个 CFG 是 否 派 生 一 个 特定 的 串 ， 另 一 个 检查 某 一 

CFG 的 语言 是 否 为 空 。 设 
Acre = {((G,w)|G 是 CFG,w 是 串 ,G 派 生 w} 

AcrG 是 一 个 可 判定 语言 。 

证 明 思路 ”对 于 CFG G 和 串 凤 ， 要 检查 G 是 否 产 生 w。 一 个 思路 是 让 G 遍历 所 有 
派生 ， 以 确定 哪 一 个 是 w 的 派生 。 但 这 个 思路 行 不 通 ， 因 为 这 样 可 能 要 检查 无 限 多 个 派 
生 。 如 果 G 不 产生 ww， 这 个 算法 将 不 终止 。 这 个 思路 给 出 的 图 灵机 只 是 Acrc 的 一 个 识别 
器 ， 而 非 判 定 器 。 


图 4-1 L(A) 5 LOB) 的 对 称 差 
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为 将 这 个 图 灵机 变 成 一 个 判定 器 ， 需 要 保证 算法 只 检查 有 限 多 个 派生 。 问 题 2. 38 证 
明了 如 果 G 是 一 个 乔 姆 斯 基 范 式 ， 则 w 的 任意 派生 都 是 2n 一 1 步 ， 其 中 是 w 的 长 度 。 
此 时 ， 为 确定 G 是 否 产 生 w， 只 需 检查 步 长 在 2n 一 1 内 的 派生 即 可 ， 这 样 的 派生 只 有 有 限 
多 个 。 而 用 在 2. 1 节 给 出 的 过 程 ， 就 可 将 G 转换 成 乔 姆 斯 基 范 式 。 

WEAR 识别 Acrc 的 图 灵机 S 如 下 : 

S=“ 对 于 输入 《G,w)， 其 中 ，G 是 一 个 CFG,， wH—-TH: 

1. 将 G 转换 成 一 个 与 之 等 价 的 乔 姆 斯 基文 法 。 

2. 列 出 所 有 2n 一 1 步 的 派生 ， 其 中 nn 是 w 的 长 度 ， 除 非 n 二 0， 此 时 列 出 一 步 以 内 
的 派生 。 

3. 如 果 这 些 派生 中 有 一 个 产生 w, MEg; 如 果 没 有 ， 则 拒绝 。” s 

检查 一 个 CFG 是 否 产 生 一 个 特定 串 和 程序 设计 语言 的 编译 密切 相关 。 图 灵机 S 中 的 算 
法 效率 非常 低 ， 并 且 永 远 不 会 在 实际 中 使 用 ， 但 它 很 容易 描述 ， 且 这 里 并 不 关心 效率 。 在 本 
书 的 第 3 部 分 将 强调 算法 的 运行 时 间 和 存储 使 用 。 定 理 7.14 的 证 明 将 描述 一 个 更 有 效 的 算 
法 来 识别 一 般 的 上 下 文 无 关 语 言 。 对 识别 确定 型 上 下 文 无 关 语 言 还 可 望 获得 更 高 的 效率 。 

在 定理 2. 12 中 已 经 给 出 了 CFG 和 PDA 之 间 的 相互 转换 过 程 。 因 此 ， 此 处 关于 CFG 
问题 的 可 判定 性 讨论 完全 适用 于 PDA, 

现在 讨论 CFG 语言 的 空 性 质 测试 问题 。 如 对 待 DFA 那样 ， 可 以 证 明 : 检查 一 个 CFG 
是 否 不 派生 任何 串 是 可 判定 的 。 设 

Ecrcg = {(G) |G 是 一 个 CFG, 且 L(G) =@} 

Ecc- ATIRE., 

证 明 思 路 ” 先 给 出 一 个 容易 想到 但 行 不 通 的 想法 : 试用 定理 4.6 中 的 图 灵机 S。 此 定 
理 告诉 我 们 ， 能 够 检查 一 个 CFG 是 否 产生 某 个 特定 串 。 为 确定 工 (G) 王 多 是否 成 立 ， 似 乎 
可 以 让 图 灵机 S 一 个 一 个 地 检查 所 有 可 能 的 w。 但 w 有 无 限 多 ， 故 这 个 算法 将 永远 检查 
下 去 ， 永 不 停止 。 我 们 需要 另 想 办 法 。 

为 检查 一 个 文法 的 语言 是 否 为 空 ， 需 要 检查 起 始 变 元 能 否 产生 一 个 终结 符 串 。 算 法 解 
决 的 是 一 个 更 一 般 的 问题 ， 它 不 仅 检 查 起 始 变 元 ， 而 且 检 查 每 一 个 变 元 ， 以 确定 这 个 变 元 
能 否 产生 一 个 终结 符 串 。 在 确定 某 个 变 元 能 够 产生 一 个 终结 符 串 后 ， 算 法 就 将 这 个 变 元 作 
上 标记 ， 以 记录 这 个 信息 。 

算法 先 在 文法 中 的 所 有 终结 符 上 作 标 记 ， 然 后 扫描 所 有 的 文法 规则 。 如 果 发 现 某 个 规 
则 人 允许 用 符号 串 来 取代 一 个 变 元 ， 且 符号 串 中 的 所 有 符号 都 已 被 作 过 标记 ， 则 算法 知道 ， 
这 个 变 元 也 能 被 作 上 标记 。 这 样 继续 下 去 ， 直 到 找 不 到 可 以 作 标 记 的 变 元 为 止 。 下 面 的 图 
灵机 R 实现 这 个 算法 。 

WE RH 

R=“ FA (G), HG 是 一 个 CFG: 

1. 将 G 中 所 有 的 终结 符 全 都 作 上 标记 。 

2. 重复 下 列 步 又 ， 直 到 找 不 到 可 以 作 标 记 的 变 元 。 

3. 如 果 G 有 规则 A 一 DUiUz…Uk， 且 Ui ,Uz,， Ur 中 的 每 个 符号 都 已 被 作 过 标 
记 ， 则 将 变 元 A 作 标 记 。 

4. 如 果 起 始 变 元 没有 被 标记 ， 则 接受 ; 否则 拒绝 。” 
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下 面 讨论 检查 两 个 上 下 文 无 关 文 法 是 否 派 生 同 一 个 语言 的 问题 。 设 
EQcrg = {(G,H)|G #H # æ CFG, AH L(G)=L(H)} 
对 有 穷 自 动机 ， 定 理 4. 5 给 出 了 判定 语言 EQbrA 的 算法 。 在 证 明 EQbrA 是 可 判定 时 ， 使 用 
了 EprA 的 判定 过 程 。 对 于 上 下 文 无 关 语言 ， 可 能 有 人 认为 ， 因 为 Ecfc 也 是 可 判定 的 ， 似 
乎 可 以 用 类 似 方法 来 证 明 EQcrc 是 可 判定 的 。 但 这 个 思路 有 问题 。 练 习 2. 2 已 经 证 明 ， 上 
下 文 无 关 语 言 类 在 补 和 交 运 算 下 不 封闭 。 事 实 上 ，EQcsc 不 是 可 判定 的 ， 这 可 用 将 在 第 5 
章 中 介绍 的 一 种 技术 来 证 明 。 
现在 来 证 明 上 下 文 无 关 语 言 都 可 以 用 图 灵机 来 判定 。 
每 个 上 下 文 无 关 语言 都 是 可 判定 的 。 
证 明 思 路 ” 设 A 是 一 个 CFL。 目标 是 证 明 A 是 可 判定 的 。 一 个 〈 行 不 通 的 ) 思路 是 : 
将 A 的 一 个 PDA 直接 转换 成 图 灵机 ， 这 并 不 难 做 到 ， 因 为 图 灵机 的 融 子 的 功能 更 强 ， 用 
来 模拟 栈 是 容易 的 。A 的 这 个 PDA 可 能 是 非 确定 型 的 ， 这 看 上 去 也 不 会 有 问题 ， 因 为 可 
将 其 转换 为 非 确 定型 图 灵机 ， 而 任何 非 确定 型 图 灵机 都 可 转化 为 与 之 等 价 的 确定 型 图 灵 
机 。 然 而 还 是 有 困难 ，PDA 计算 的 某 些 分 支 可 能 会 永远 进行 ， 即 不 停 地 在 栈 上 读 和 写 而 
不 能 停机 。 这 样 一 来 ， 模 拟 它 的 图 灵机 也 就 有 不 停机 的 计算 分 文 ， 因 而 这 个 图 灵机 就 不 是 
一 个 判定 器 。 故 必须 有 不 同 的 思路 。 本 定理 的 证 明 使 用 了 判定 Acrc 的 图 灵机 S， 这 个 图 灵 
机 是 在 定理 4. 6 中 设计 的 。 
证 明 设 G 是 A 的 一 个 CFG。 下 面 设计 一 个 判定 A 的 图 灵机 Mc ， 它 在 自己 内 部 建 
立 G 的 一 个 备份 。 其 工作 方式 如 下 : 
Mc 一 “对 于 输入 w: 
1. 在 输入 (G, w) 上 运行 图 灵机 S. 
2. 如 果 该 机 器 接受 ， 则 接受 ; 若 拒 ere 
绝 ， 则 拒绝 。” a 
至 此 ， 本 课程 描述 了 四 个 主要 语言 类 : E 
则 的 、 上 下 文 无 关 的 、 可 判定 的 和 图 灵 可 识别 


的 ， 定 理 4.8 在 它们 之 间 的 关系 图 中 男 出 了 最 


后 一 条 连 线 。 图 4- 2 描述 了 这 个 关系 。 图 4-2 语言 类 间 的 关系 


4.2 不 可 判定 性 


本 节 将 证 明 算 法 不 可 解 的 问题 是 存在 的 ， 这 是 计算 理论 中 最 具 哲 学 意义 的 定理 之 一 。 
计算 机 看 上 去 是 如 此 强大 ， 使 得 人 们 相信 所 有 问题 最 终 都 能 被 其 解决 。 可 是 上 述 定 理 说 
明 ， 本 质 上 计算 机 的 能 力 是 有 局 限 的 。 

什么 样 的 问题 是 计算 机 不 能 解 的 呢 ? 不 可 解 问 题 是 否 深奥 得 仅 藏 于 理论 科学 家 的 心中 
呢 ? 不 ! 现在 已 经 证 明 ， 甚 至 一 些 人 们 非常 希望 解决 的 普通 问题 都 是 计算 上 不 可 解 的 。 

不 可 解 问题 之 一 是 : 假设 你 有 一 个 计算 机 程序 ， 还 有 一 个 说 明 书 ， 精 确 地 说 明了 此 程 
序 将 做 什么 〈 例 如 ， 说 明 此 程序 将 把 一 串 数 列 进行 排序 )。 你 要 做 的 是 : 验证 该 程序 正 像 
说 明 书 所 说 的 那样 运行 〈 即 它 是 正确 的 ) 。 因 为 程序 和 说 明 书 都 是 像 数 学 一 样 的 精确 对 象 ， 
你 希望 将 验证 过 程 自动 化 ， 即 将 这 些 对 象 提 供给 一 个 适当 设计 的 计算 机 来 验证 。 但 你 将 会 
失望 ， 因 为 一 般 的 软件 验证 问题 用 计算 机 是 不 能 解决 的 。 

本 节 和 第 5 章 都 将 介绍 一 些 不 可 解 问题 ， 目 的 是 帮助 你 了 解 这 类 不 可 解 问题 并 学 习 证 







图 灵 可 识别 的 
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明 不 可 解 性 的 技巧 。 

现在 介绍 第 一 个 不 可 解 性 定理 。 下 面 的 语言 是 不 可 判定 的 : 检查 一 个 图 灵机 是 否 接受 
一 个 给 定 的 串 问 题 。 类 似 于 Anra 和 Acre, WZH Arm. 18 Anra 和 Acre 是 可 判定 的 ， 
ATM 却 不 是 。 


A 


Arm ={(M,w)|Mz—-4* BRL, HES w) 
ATM 是 不 可 判定 的 。 
先 证 明 Arw 是 图 灵 可 识别 的 。 这 样 ， 本 定理 表明 识别 器 确实 比 判 定 器 更 强大 。 要 求 图 灵 
机 (TM) 在 所 有 输入 上 都 停机 限制 了 它 能 够 识别 的 语言 种 类 。 下 面 的 图 灵机 U 识别 Am. 
U 二 “对 于 输入 〈M,w)， 其 中 M 是 一 个 图 灵机 ，w 是 一 个 串 : 
1. 在 输入 w 上 模拟 M ; 
2. WR M 进入 接受 状态 ， 则 接受 ; WR M 进入 拒绝 状态 ， 则 拒绝 。?” 
TER, WARM 在 w 上 循环 ， 则 机 器 UU 在 输入 (M, w) EDM, RU 不 判定 AT™ 
的 原因 。 假 如 MAR ACH we 上 不 停机 ， 这 种 情况 下 它 会 拒绝 。 然 而 ， 算 法 本 身 无 法 做 
这 样 的 决定 。 待 会 儿 我 们 会 看 到 这 种 情况 。 
图 灵机 U 目 身 也 很 有 意思 ， 它 是 所 谓 通 用 图 灵机 的 一 个 例子 。 通 用 图 灵机 是 图 灵 于 
1936 年 首次 提出 的 ， 之 所 以 称 之 为 “通用 ”， 是 因为 它 能 够 模拟 任何 其 他 图 灵机 ， 只 要 知 
道 其 描述 即 可 。 通 用 图 灵机 在 开发 早期 的 程序 存储 式 计 算 机 过 程 中 曾 起 过 重要 作用 。 


4.2.1 对 角 化 方法 


ATM 不 可 判定 性 的 证 明 使 用 了 所 谓 的 对 角 化 技术 ， 此 方法 由 数学 家 康 托 (Georg 
Cantor) 在 1873 年 提出 。 康 托 那 时 关心 的 是 测量 无 限 集合 的 规模 问题 。 假 如 有 两 个 无 限 
集合 ， 怎 么 才能 说 其 中 一 个 比 另 一 个 大 ， 或 者 说 有 相同 的 规模 呢 ? 当然 ， 对 于 有 限 集 合 ， 
回答 这 样 的 问题 很 简单 。 只 要 数 一 数 某 个 有 限 集合 中 元 素 的 个 数 ， 所 得 的 数 就 是 它 的 规 
模 。 但 是 ， 如 果 试 图 去 数 一 个 无 限 集合 中 的 元 素 个 数 ， 将 永远 也 数 不 完 。 所 以 不 能 用 计数 
的 方法 来 确定 无 限 集合 的 相对 规模 。 

例如 ， 对 所 有 偶数 的 集合 和 {0,1} 上 所 有 串 的 集合 ， 这 两 个 集合 都 是 无 限 的 ， 因 而 比 
任何 有 限 集 合 都 大 。 但 它们 中 是 否 有 一 个 比 另 一 个 更 大 呢 ? 怎么 比较 它们 的 相对 规模 呢 ? 

康 托 对 此 提出 了 一 个 非常 好 的 解决 办 法 。 他 注意 到 : 对 于 两 个 有 限 集 合 ， 如 果 其 中 一 
个 集合 的 元 素 能 与 男 一 集合 的 元 素 配 对 ， 则 它们 有 相同 的 规模 。 这 个 方法 没有 凭借 计数 就 
比较 了 规模 ， 因 而 可 以 将 此 思想 推广 到 无 限 集 合 上 。 这 是 它 更 准确 的 含义 。 

RA BREAABES, FAMARI BHAA., WHR f 从 不 将 两 个 不 同 
元 素 映 射 到 同一 个 对 象 ， 即 只 要 4a 了 关 b 就 有 fla Af), Me f 是 一 对 一 映射 《one-to- 
one) 的 。 如 果 了 能 击 中 B 的 每 个 元 素 ， 即 ; 对 B 的 每 个 元 素 5， 都 存在 a€ A， 使 得 
flav=b, War f SHARE Conto, surjective), WRAL BR f:A 一 B，f 是 一 对 一 映射 
又 是 满 映 射 ， 则 称 集合 A 和 B 有 相同 规模 。 而 既是 一 对 一 映射 又 是 满 映 射 的 函数 称 为 对 
应 (correspondence)。 在 对 应 中 ，A 的 每 个 元 素 映 射 到 B 的 唯一 一 个 元 素 ， 且 B 的 每 个 
元 素 都 有 A 的 唯一 一 个 元 素 映 射 到 它 。 对 应 就 是 将 A 的 元 素 与 B 的 元 素 进行 配对 的 方法 。 

一 对 一 映射 又 称 为 单 射 (injective)， 对 应 又 称 为 双 射 (bijective)。 
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ARI 设 N 是 自然 数 集合 {1,2,3,…)，E 是 偶 自 然 数 的 集合 (2,4,6,…}。 用 康 托 
的 关于 集合 规模 的 定义 可 以 看 到 : NA E 有 相同 的 规模 。 从 N 
映射 到 E 的 对 应 /是 f(n) 二 2n。 借 助 于 表 4- 1 能 更 容易 地 看 清 f. NN 

这 个 例子 似乎 令 人 意外 。 直 观 上 ，8 似乎 比 N 小 ， 因 为 
E 是 N 的 一 个 真子 集 。 但 由 于 能 够 将 N 的 元 素 与 € 的 元 素 
gji 故 可 以 下 结论 说 这 两 个 集合 有 相同 的 规模 。 本 

如 果 一 个 集合 A 是 有 限 的 或 者 与 N 有 相同 的 规模 ， 则 称 A 是 可 数 的 


(countable) 。 

EED ”现在 介绍 一 个 更 令 人 意外 的 例子 。 设 Q= | 开 |m,nEN | 是 正 有 理 数 集合 ， 
Q 看 上 去 似乎 比 N 大 得 多 ， 然 而 按照 定义 ， 这 两 个 集合 的 规模 相同 。 下 面 先 给 出 Q 到 NN 
的 一 个 对 应 ， 这 证 明了 Q 是 可 数 的 ， 从 而 也 就 证 明了 本 结论 。 给 出 一 个 Q 到 N 的 对 应 的 简 
单方 法 是 ， 先 列 出 Q 的 所 有 元 素 ， 然 后 将 此 序列 中 的 第 一 个 元 素 与 N 中 的 1 配对 ， 将 第 二 个 
元 素 与 2 配对， 依 此 类 推 。 注 意 ， 必 须 保证 Q 中 的 每 个 元 素 在 此 序列 中 只 出 现 一 次 。 

为 得 到 这 样 的 序列 ， 构 造 下 面包 含 所 有 正 有 理 数 的 矩阵 ， 如 图 4- 3 所 示 。 第 i 行 包含 


所 有 分 子 为 i 的 数 ， 第 j 列 包含 所 有 分 母 为 的 数 。 故 出 现在 第 i 行 和 第 j 列 交叉 处 。 
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图 4-3 N 与 Q 的 对 应 


现在 将 此 矩阵 转化 成 一 个 序列 。 一 个 〈 行 不 通 的 ) 思路 是 : 序列 以 第 一 行 的 所 有 元 素 
开始 。 但 因为 第 一 行 是 无 限 的 ， 序 列 将 不 会 到 达 第 二 行 ， 故 此 思路 不 好 。 换 用 下 面 的 方 
法 : 从 角落 开始 ， 排 列 在 对 角 线 上 的 所 有 元 素 ， 这 些 对 角 线 已 经 附加 在 图 4- 3 中 。 第 一 条 


对 角 线 只 包含 一 个 元 素 工 ， 第 二 条 对 角 线 包含 两 个 元 素 工 和 元， 所 以 此 序列 的 前 三 个 元 素 
是 于， 卫生。 第 三 条 对 角 线 上 有 麻烦 ， 它 包含 子 ， 和 二 。 如 果 简单 地 将 它们 加 到 序列 


中 ， 就 重复 了 二 一 尺 。 为 避免 重复 ， 忽 略 引起 重复 的 元 素 。 所 以 仅仅 加 入 两 个 新 元 素 二 和 


地。 以 这 种 方法 继续 下 去 ， 就 得 到 Q 的 所 有 元 素 的 一 个 序列 。 ‘ 
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看 过 NN 与 Q 的 对 应 之 后 ， 你 也 许 会 认为 ， 可 以 证 明 任 意 两 个 无 限 集合 都 有 相同 规模 。 毕 
竟 只 要 给 出 一 个 对 应 即 可 ， 这 个 例子 也 说 明了 确实 存在 某 些 不 可 思议 的 对 应 。 但 是 ， 还 是 有 
一 些 集合 因为 太 大 了 ， 故 没有 与 N 的 对 应 。 这 样 的 集合 称 为 不 可 数 的 〈uncountable) 。 

实数 集 便 是 一 个 不 可 数 集合 的 例子 。 实 数 (real number) 是 用 十 进 制 表示 的 数 。 数 
r 一 3. 1415926… 和 V2 王 1. 4142135… 都 是 实数 。 设 R 是 实数 集合 。 康 托 证 明了 R 是 不 可 数 
的 。 下 面 用 对 角 线 方法 证 明之 。 

CEED REKTHKH. 

证 明 ”为 证 明 R 是 不 可 数 的 ， 必 须 证 明 在 N 与 R 之 间 不 存在 对 应 。 下 面 用 反 证 法 证 
明之 : 假设 在 N 与 R 间 存 在 对 应 f/， 现 在 的 任务 是 证 明 它 没有 应 有 的 性 质 。 因 为 它 是 一 个 
对 应 ， 所 以 必 能 将 N 的 所 有 元 素 与 R 的 所 有 元 素 进行 配对 。 如 果 能 找到 R 中 的 一 个 x 和 
N 中 的 任何 元 素 都 不 能 配对 ， 则 找到 了 矛盾。 

为 此 ， 实 际 构造 出 这 样 一 个 zx。 方 法 为 : 在 选择 它 的 
每 一 位 数字 时 ， 都 使 得 x 不 同 于 某 个 实数 ， 且 此 实数 已 与 表 4-2 假定 存在 的 N 与 









N 中 一 个 元 素 配 对 。 这 样 就 能 保证 zx 不 同 于 任何 已 配对 的 R 间 的 对 应 f 
用 一 个 例子 来 说 明 这 个 思路 。 假 设 对 应 f 存在 ， 且 设 dl 
f(1)=3.14159.…,f(2)= 二 55.55555.…,f(3) 二 …， 等 等 。 59. 99999 


0. 123455…。 


则 KH HIR 1 与 3. 14159… 配 对 ， 将 2 5 55.55555. M 
对 ， 依 此 类 推 。 表 4-2 给 出 了 此 假定 存在 的 f 的 一 些 值 ，f 
联系 了 NAR. 

只 要 给 出 z 的 十 进 制 表示 ， 则 z 就 可 以 构造 出 来 。 所 构造 的 是 在 0 与 1 之 间 的 一 个 
数 ， 所 以 重要 的 是 小 数 点 后 面 的 数字 。 要 保证 对 每 个 nn 都 有 xz 了 关 f(n)。 为 保证 x 关 f(1)， 
只 要 保证 r 的 第 一 位 小 数 不 同 于 f(1) = 二 3.14159… 的 第 一 位 小 数 ， 即 不 是 数字 1， 随 意 地 
令 它 为 4。 为 保证 cA S(2), REIRE r 的 第 二 位 小 数 不 同 于 f(2) 二 55. 555555… 的 第 二 
位 小 数 ， 即 不 是 数字 5， 任 意 地 令 它 为 6; f(3)=0. 12345… 

的 第 三 位 小 数 是 3， 故 可 取 xz 的 第 三 位 小 数 是 任 一 个 不 为 3 ded SIT 

的 数字 ， 比 如 4。 沿 着 表 4- 2 中 f 的 对 角 线 ， 以 这 种 方法 
继续 下 去 ， 就 能 够 得 到 xz 的 所 有 数字 ， 如 表 4- 3 所 示 。 不 
WAÉ, HER n, r 都 不 是 fl(n)， 因 为 z fm ER n 
个 小 数位 上 不 同 。( 有 一 个 小 问题 。 有 些 数 ， 如 0. 1999… 和 
0. 2000…， 虽 然 它 们 的 十 进 制 表示 不 同 ， 但 它们 却 相 同 。 
只 要 在 构造 x 时 不 选 数字 0 和 9， 就 可 避免 这 个 问题 。) 时 

上 述 定 理 对 计算 理论 有 着 重要 的 应 用 ， 它 表明 有 些 语 言 是 不 可 判定 的 ， 甚 至 不 是 图 灵 
可 识别 的 ， 原 因 是 : 有 不 可 数 个 语言 ， 却 只 有 可 数 个 图 灵机 。 由 于 一 个 图 灵机 只 能 识别 一 
个 语言 ， 而 语言 比 图 灵机 更 多 ， 故 有 些 语言 不 能 用 任何 的 图 灵机 识别 。 这 样 的 语言 就 不 是 
图 灵 可 识别 的 ， 正 如 下 面 推论 所 说 。 

(oD 存在 不 能 被 任何 图 灵机 识别 的 语言 。 

证 明 为 证 明 所 有 图 灵机 构成 的 集合 是 可 数 的 ， 首 先 证 明 : 对 任意 的 字母 表 E, HE 
所 有 串 的 集合 5* 是 可 数 的 。 这 是 因为 ， 对 每 个 自然 数 n， 长 度 为 n 的 串 只 有 有 限 多 个 。 


3 | 


0. 500000… 









3. 14159- 
55. 55555- 
0.123455 2=0. 4641+ 


. CA bo — z 


0. 50000… 
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我 们 先 写 下 长 度 为 0 的 所 有 串 ， 再 写 下 长 度 为 1 的 所 有 串 ， 再 写 下 长 度 为 2 的 所 有 串 ， 依 
此 类 推 ， 这 样 就 能 构造 出 3* 的 序列 。 

由 所 有 图 灵机 构成 的 集合 是 可 数 的 ， 原 因 是 : 每 个 图 灵机 有 一 个 编码 ， 它 是 一 个 串 
(M) 。 只 要 去 掉 那 些 不 是 图 灵机 合法 编码 的 串 ， 就 得 到 了 所 有 图 灵机 的 序列 。 

为 证 明 由 所 有 语言 构成 的 集合 是 不 可 数 的 ， 首 先 证 明 由 所 有 无 限 二 进 制 序列 构成 的 集 
合 是 不 可 数 的 。 所 谓 的 无 限 二 进 制 序列 是 指 由 0 或 1 构成 的 无 限 序列 。 以 8 记 所 有 无 限 二 
进 制 序列 构成 的 集合 。 可 以 通过 对 角 化 方法 来 证 明 B 是 不 可 数 的 ， 此 法 类 似 于 定理 4. 14 
所 用 的 方法 ， 只 不 过 那 时 是 证 明 R 是 不 可 数 的 。 

设 C 是 字母 表 卫 上 所 有 语言 的 集合 。 只 要 给 出 C 与 B 的 一 个 对 应 ， 就 证 明了 这 两 个 
集合 有 相同 的 规模 ， 也 就 证 明 CAAT RAY. WD* S {s nass) BAR ACLE B 
中 都 有 唯一 的 一 个 相应 序列 : 如 果 s%EA， 则 此 序列 的 第 A 1; MRS EA, WIS 
的 第 i 位 为 0。 此 序列 被 称 为 A 的 特征 序列 (characteristic sequence). fila, WR A EF 
母 表 (0, 1} 上 以 0 开始 的 串 构 成 的 语言 ， 则 其 特征 序列 y, Æ: 

Se= {e,0,1,00,01,10,11,000,001,«*}; 
A=4 DOols 000,001,°::}; 
X = 010110011… 

SKA f:L>BA: f(A) 是 A 的 特征 序列 ， 则 f 是 一 对 一 且 满 映射 的 ， 即 是 一 个 对 
应 。 因 为 8 是 不 可 数 的 ， 故 L 也 是 不 可 数 的 。 

至 此 ,已 证 明了 所 有 语言 的 集合 与 折 有 图 灵机 的 集合 之 间 不 能 有 对 应 。 因 此 可 以 下 结 
论说 : 存在 不 能 被 任何 图 灵机 识别 的 语言 。 s 


4.2.2 不 可 判定 语言 


至 此 ， 我 们 已 为 证 明和 定理 4.9 做 了 充分 准备 ， 现 在 证 明 下 列 语 言 的 不 可 判定 性 : 
ATM 一 {((M,w)|M 是 一 个 图 灵机 ，, 且 M 接受 忆 )} 

证 明 假设 Arw 是 可 判定 的 ， 下 面 将 由 之 导出 矛盾 。 设 互 是 Arw 的 判定 器 。 令 M 是 
一 个 图 灵机 ，w 是 一 个 串 。 在 输入 (Mow) E, Ww M 接受 w， 则 H 就 停机 且 接 受 w; 
如 果 ME PRZ w, M H 也 会 停机 ， 但 拒绝 w。 换 句 话 说 ， 昌 是 一 个 图 灵机 ， 使 得 : 

接受 ”如果 M 接受 也 
ONO 5 DRM REE w 

现在 来 构造 一 个 新 的 图 灵机 也， 它 以 五 作为 子 程序 。 当 M 被 输入 它 自己 的 描述 〈M) 
时 ， 图 灵机 D 就 调用 及 ,以 了 解 M 将 做 什么 。 一 旦 得 到 这 个 信息 ，D 就 反 着 做 ， 即 : 如 
果 M 接受 ， 它 就 拒绝 ; 如 果 M 不 接受 ， 它 就 接受 。 下 面 是 了 的 描述 。 

D=“ FAA (M), HH M 是 一 个 图 灵机 : 

1. 在 输入 〈M,《M)〉 上 运行 H. 
2. 输出 与 H 输出 的 相反 结论 ， 即 如 果 ARS, Mee; 如 果 ABA, RHE.” 

不 要 被 “在 一 个 机 器 上 运行 它 自己 的 描述 ”这 个 表示 法 所 困扰 ， 这 类 似 于 以 一 个 程序 
本 身 作 为 输入 来 运行 这 个 程序 ， 这 在 实际 中 确实 时 有 发 生 。 例 如 ， 编 译 器 是 翻译 其 他 程序 
的 程序 。Python 语言 的 编译 器 也 许 就 是 以 Python 写 的 ， 所 以 “在 一 个 程序 本 身上 运行 这 
个 程序 ”是 有 意义 的 。 总 而 言 之 ， 
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接受 如果 MM 不 接受 (M) 

拒绝 如 果 M 接 受 (M) 

4U DWH (D) 作为 输入 来 运行 卫 上 自身 时 ， 结 果 会 怎样 呢 ? 我 们 得 到 : 

ze wRD FELD) 

拒绝 wR DZD? 

Rit 了 做 什么 ， 它 都 被 迫 相 反 地 做 ， 这 显然 是 一 个 矛盾 。 所 以 ， 图 灵机 DARRHLH 都 

不 存在 。 z 
回顾 一 下 上 述 证 明 步 又 。 先 假设 图 灵机 H HAM: 然后 用 互 来 构造 一 个 图 灵机 

D, ERSRA (M), 4AM4 M 不 接受 输入 〈M); 最 后 在 DD 自身 上 运行 D。 因 此 ， 这 

些 机 器 发 生 下 列 动 作 : 

。 HZ (M, w) HAN MÈ w 

e DE% (M), 4HW4 M 接受 (M). 

。 DE% (D), 4HM4 DRX (D). 

最 后 一 行 是 矛盾 的 。 

在 定理 4. 9 的 证 明 中 ， 什 么 地 方 有 对 角 化 呢 ? 只 要 检查 一 下 图 灵机 互 和 图 灵机 DD 的 
行为 表 就 清楚 了 。 在 这 些 表 中 ， 将 所 有 图 灵机 Mi ,Mi ,… 沿 列 方向 排列 ， 将 它们 的 描述 
(Mi )》，(Mz)，… 沿 行 方向 排列 。 表 值 说 明了 所 在 行 中 的 机 器 是 否 接受 所 在 列 中 的 输入 ， 
如 接受 ， 则 表 值 为 accept; 如 拒绝 或 在 此 输入 上 循环 ， 则 表 值 为 空白 。 图 4-4 编排 了 所 有 
的 表 值 以 说 明 上 述 想法 : 

而 在 图 4- 5 中 ， 表 值 是 H 的 运行 结果 ， 其 输入 与 图 4- 4 对 应 位 置 一 致 。 例 如 ， 如 果 
Ms 不 接受 输入 《Ms );， 则 在 第 Ms 行 和 第 〈Mz 》 列 交叉 处 的 表 值 是 reject， 因 为 H 拒绝 
输入 〈Mas ,(Mz ) ) 。 


DOM)= | 


DCCD)) 一 | 








(M) (Mə) (Ma) (Mà -> (Mı) (M2) (M3) _ (Ma) 
accept accept Mı reject accept reject 

Mz | accept accept accept accept M2 | accept accept accept accept .. 
M3 M3 | reject reject reject reject 
igiit Ma | accept accept reject reject 


Ma4 | accept accept 


图 4-4 如 果 M; 接受 (M;), Al 4-5 (i,7) WREE 互 在 输入 
则 (i,7) 的 表 值 是 accept (M;,<(M;)>) 上 的 值 


图 4- 6 是 在 图 4- 5 中 加 入 也。 根据 假设 ， 五 是 一 个 图 灵机 ， 所 以 D 也 是 一 个 图 灵机 ， 
因此 必定 在 所 有 图 灵机 的 序列 Mi »M2 ，,… 中 出 
W. ER, D 按 对 角 线 表 值 的 相反 值 计 算 。 M 


(Mi) (M2) (M3) (Ma) - (D) 


accept reject accept reject accept 





























. S PF Mp | accept accept accept accept accept 
在 [a] 5 处 天 EF 盾 ’ 那 里 的 表 值 Wy 须 与 已 A M3 | reject reject reject reject reject 
g 相 反 Ma | accept accept reject reject accept 
42.3 一 个 图 灵 AN 可 18 别 | 语 言 D | reject reject accept accept ? 
上 市 介绍 了 一 个 不 可 判定 的 语言 : Arm. 
现在 介绍 男 一 个 语言 ， 此 语言 甚至 不 是 图 灵 图 4-6 WR DEA PR, 


可 识别 的 。 注 意 ，Afrw 还 不 是 这 样 的 语言 ， ETF] ib Pe eH J 
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为 已 经 证 明 Arm 是 图 灵 可 识别 的 。 下 面 的 定理 表明 : 如 果 一 个 语言 和 它 的 补 都 是 图 灵 可 识 
别 的 ， 则 此 语言 也 是 可 判定 的 。 这 样 ， 对 任何 不 可 判定 语言 ， 它 或 它 的 补 至 少 有 一 个 不 是 
图 灵 可 识别 的 。 回 想 一 下 ， 一 个 语言 的 补 是 由 不 在 此 语言 中 的 所 有 串 构成 的 语言 。 如 果 一 个 
语言 是 一 个 图 灵 可 识别 语言 的 补 集 ， 则 称 它 是 补 图 灵 可 识别 的 〈co-Turing-recognizable) 。 

(下 本 5 坟 ”一 个 语言 是 可 判定 的 ， 当 且 仅 当 它 既是 图 灵 可 识别 的 ， 也 是 补 图 灵 可 识 
别 的 。 

换 句 话说 ， 一 个 语言 是 可 判定 的 ， 当 且 仅 当 它 和 它 的 补 都 是 图 灵 可 识别 的 。 

证 明 ”要 证 明 两 个 方向 。 首 先 ， 如 果 A 是 可 判定 的 ， 很 容易 看 出 A 和 它 的 补 A 都 是 
图 灵 可 识别 的 ， 因 为 任何 可 判定 语言 都 是 图 灵 可 识别 的 ， 且 任何 可 判定 语言 的 补 也 是 可 判 
定 的 。 

下 面 证 另 一 个 方向 。 如 果 A 和 去 都 是 图 灵 可 识别 的 ， 令 Mi 是 ABRIR, Mm 是 A 
的 识别 器 。 下 列 图 灵机 M 是 A 的 判定 器 : 

M=“ FA w: 

1. 在 输入 w 上 并 行 运行 Mi MM. 
2. 如 果 M 接受 ， 就 接受 ; WRM 接受 ， 就 拒绝 。” 

并 行 地 运行 两 个 机 器 指 的 是 : M 有 两 个 带 ， 一 个 模拟 Mi ， 另 一 个 模拟 Ma 。 此 时 ，M 
交替 地 模拟 两 个 机 器 的 一 步 ， 一 直 持 续 到 其 中 之 一 接受 。 

现在 证 明 M 确实 判定 A。 任 一 个 串 ww 要 么 在 A t, HAEA., HMA, Mi MM: 
必定 有 一 个 接受 w。 因 为 只 要 Mi 或 Ms 接受 ，M 就 停机 ， 所 以 M 总 会 停机 ， 因 而 它 是 个 
判定 器 。 还 有 ，M 接受 所 有 在 A 中 的 串 ， 拒 绝 所 有 不 在 A PH, MEA 的 判定 器 ， 
因而 A 是 可 判定 的 。 € 

ATrM 不 是 图 灵 可 识别 的 。 

证 明 Ar 是 图 灵 可 识别 的 。 如 果 Arw 也 是 图 灵 可 识别 的 ， 则 Arw 将 是 可 判定 的 。 但 
定理 4. 9 说 Ar 不 是 可 判定 的 ， 所 以 Arw 肯 定 不 是 图 灵 可 识别 的 。 a 


练习 
4.1 对 于 下 图 所 示 的 DFA M， 回 答 下 列 问题 ， 并 说 明理 由 。 





a. (M,0100) € Apra ? b. (M,011) E€ Apra ? 
Cc. (M) € Apra? d. «(M,0100) € Arex? 
e. (M) € Epra? f. (M,M) E EQpra? 


4.2 考虑 一 个 DFA 和 一 个 正则 表达 式 是 否 等 价 的 问题 。 将 这 个 问题 表述 为 一 个 语言 并 证 明 它 是 可 判 
定 的 。 
4.3 设 ALLpra= 二 {14A)|A —~7F DFA, H L(A)=S5* }。 证明 ALLpFA 是 可 判定 的 。 


4.4 


A4.5 
4.6 


4.7 


4.8 
4.9 
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设 Aecrc = (G) |G 是 一 个 生成 es 的 CFG}。 证 明 Aecrc 是 可 判定 的 。 

it Erm 二 {(M) |M 是 一 个 图 灵机 ,上 且 L(M) 二)。 证明 Erm 的 补 Erm 是 图 灵 可 识别 的 。 
设 X 是 集合 (1,2,3,4,5}, Y 是 集合 {6,7,8,9,10})。 

以 表 4-4 描述 函数 f:X>Y 和 函数 g:X>Y。 回 答 下 列 Sit ERIRE 
每 一 个 问题 ， 并 对 给 出 否定 的 答案 说 明理 由 。 

Aa, f 是 一 对 一 的 吗 ? Ad. g 是 一 对 一 的 吗 ? 
b. 是 满 映射 的 吗 ? e. g 是 满 映 射 的 吗 ? 
c. 是 对 应 的 吗 ? f. g 是 对 应 的 吗 ? 
BE (0,1) 上 所 有 无 限 序列 的 集合 。 用 对 角 化 方法 
证 明 B 是 不 可 数 的 。 

设 T=((i,j,k) li,j,. KEN}. WEI TETA. 

回想 一 下 定义 4. 10 中 采用 的 定义 集合 具有 相同 规模 的 方法 ， 并 证 明 “ 有 相同 规模 ”是 一 个 等 价 
关系 。 





引 理 2. 25 的 证 明 中 提 到 对 DPDA P， 当 PP 从 状态 gq FHM, creer) 是 栈 顶 符号 时 ， 若 它 从 不 
弹出 任何 xz PNAS. BARRA MAAS. WER Cr) 是 looping RA. X F={(Poq, 
x)|\(qsx) 是 一 个 对 于 P 的 looping 状况 }， 证 明 下 是 可 判定 的 。 

对 于 CFL G 中 的 变 元 A ， 如 果 它 在 某 个 字符 串 w(zwEG) 的 派生 中 出 现 ， 则 称 A 是 可 用 的 《us- 
able) 。 给 定 一 个 CFG G 和 一 个 变 元 A ， 考 虑 测试 A 是 否 为 可 用 的 这 样 一 个 问题 。 将 该 问题 形 
式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

设 A 是 由 某 些 图 灵机 的 描述 构成 的 一 个 图 灵 可 识别 语言 {(Mi ), (Mi ),…}， 其 中 每 个 M; 都 是 
FER. RUE: AFA Mi 的 描述 在 A 中 ,那么 存在 可 判定 语言 D, 但 它 不 能 被 任何 M; 所 判 
E. RR: 考虑 A 的 一 个 枚 举 器 或 许 有 用 。) 

it Cere = {(G,k) |G 是 一 个 CFG, 且 L(G) 恰 好 包含 有 个 字符 串 , 其 中 有 宇 0 ak k=}, 证 明 Cere 
是 可 判定 的 。 

设 C={(G,zx)1G 是 一 个 CFG,z 是 某 个 >yEEL(G) 的 子 串 }， 证 明 C 是 可 判定 的 。 (提示: 使 用 
Ecrc 的 判定 器 是 个 好 方法 。) 

设 下 = {(M) | M 是 一 个 DFA， 它 接受 1 比 0 多 的 串 }， 证 明 五 是 可 判定 的 。( 提 示 : 一 些 关 于 
CFL 的 定理 对 此 会 有 帮助 。) 

设 PALors 王 {(M) | M 是 一 个 接受 某 些 回 文 的 DFA}, 证 明 PALorA 是 可 判定 的 。 (提示 : 一 些 关 
于 CFL 的 定理 对 此 会 有 帮助 。) 

设 BALppa= { (M) | M 是 一 个 DFA， 它 接受 含有 相同 个 数 的 0 和 1 的 串 }， 证 明 BALorA 是 可 
判定 的 。( 提 示 : 一 些 关 于 CFL 的 定理 对 此 会 有 帮助 。) 

下 推 自 动机 的 一 个 无 用 状态 (useless state) 是 指 在 任何 输入 上 都 不 会 进入 的 状态 。 考 虑 检查 一 
个 下 推 自动 机 是 否 有 无 用 状态 的 问题 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

对 于 那些 可 以 从 两 个 不 同 计 算 分 支 接受 某 些 字符 串 的 NFA， 称 其 是 有 二 义 的 〈ambiguous) 。 设 
AMBIGyr, = {(N)|N 2-44 — XB NFA}, 证 明 AMBTIGCseA 是 可 判定 的 。( 建 议 : 一 种 较 好 的 
解决 方法 是 先 构造 一 个 适当 的 DFA， 然 后 在 其 上 运行 Evra 。) 

it S={(M)|M 是 DFA, 且 只 要 接受 ww, 就 接受 uw). HA S$ 是 可 判定 的 。 

it PREFIX-FREE x, 二 {RIR 是 一 个 正则 表达 式 , 日 L(R) 是 前 缀 无 关 的 }。 证 明 PREFIX-FREE x & J 
判定 的 。 为 什么 相似 的 方法 无 法 证 明 PREFIX-FREEcrc 是 可 判定 的 ? 

设 A 和 B 是 两 个 不 交 的 语言 。 称 语言 COB (separate) AMB, w ACC H BCC, 证 明 任 意 
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两 个 不 交 的 补 图 灵 可 识别 语言 都 可 由 某 个 可 判定 语言 分 离 。 
证 明 可 判定 的 语言 类 在 同 态 下 不 封闭 。 


设 C 是 一 个 语言 。 证 明 C 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 一 个 可 判定 语言 D, 使 得 C= 二 {zx|3y 
(Ker yy E Dry 

检查 两 个 DFA 在 规模 小 于 或 等 于 某 个 数 的 所 有 串 上 的 和 运行， 并 以 此 方法 证 明 EQpes 是 可 判定 的 。 
计算 这 样 的 一 个 数 。 


WA= (《R)|R 是 一 个 正则 表达 式 ， 其 所 描述 的 语言 中 至 少 有 一 个 串 w 以 111 为 子 串 〈 即 有 z 和 
y 使 得 ww 二 x111y)}。 证 明 A 是 可 判定 的 。 

证 明确 定 一 个 CFG 是 否 生 成 1* 中 的 所 有 串 的 问题 是 可 判定 的 。 换 言 之 , 证 明 (<(G)|G #{0,1} 
上 的 一 个 CFG, 且 1x*SLCG)) 是 一 个 可 判定 语言 。 

w= (0，1})， 证 明确 定 一 个 CFG 是 否 生 成 1* 中 的 串 的 问题 是 可 判定 的 。 换 言 之 ， 证 明 {((G)| 
G 是 {0,1} 上 的 一 个 CFG， 且 1x 门 L(G) 关 名 } 是 一 个 可 判定 语言 。 
wA={(R,S)|RAS 是 正则 表达 式 ， 且 L(R)SCL(S)}, 证 明 A 是 可 判定 的 。 

wWA= { (M) | M 是 DFA， 它 不 接受 任何 包含 奇数 个 1. 的 串 } ,证明 A 是 可 判定 的 。 

设 INFINITEpp, = {(M)|M #—%* PDA, E L(MMW) 是 一 个 无 限 语言 );。 证 明 INFINITE, 是 可 判 
定 的 。 

设 TNFINITEom 王 ({((A)1A 是 一 个 DFA, 且 L(A) 是 一 个 无 限 语 言 }。 证 明 INFINITE 是 可 判 
定 的 。 


习题 选 解 


4.1 


a. 是 。DFA M 接受 0100, b. 和 否 。M 不 接受 011, 
ce 否 。 输 入 只 有 一 个 组 成 部 分 ， 因 此 形式 不 正确 。 
d 否 。 前 半 部 分 不 是 正则 表达 式 ， 因 此 输入 的 形式 不 正确 。 
e 否 。M 的 语言 非 空 。 f. 是 。M 接受 和 它 自身 相同 的 语言 。 
设 5 ,ss，… 是 5 上 的 所 有 字符 串 。 下 述 图 灵机 识别 Erm 。 
“St FRA M), HP M 是 一 个 图 灵机 : 

1. 对 i 二 1,2,3,… ,重复 下 面 步 又 。 

“2. 在 每 个 输入 mw sess, 上 ，M 运行 i H. 

3. WR M 接受 了 其 中 任意 一 个 ， 则 接受 。 否 则 ， 继 续 。” 
a B. AAOS), MU f 不 是 一 对 一 的 。 
d Æ: g ÆW i 
由 所 有 具有 相同 个 0 和 1 的 字符 串 构 成 的 语言 是 一 个 上 下 文 无 关 语 言 ， 可 以 由 文法 S—>180S| 
0S1Sle 来 生成 。 设 已 是 可 识别 该 语言 的 一 个 PDA， 构 造 一 个 BALbss 的 图 灵机 M， 其 操作 过 程 如 
F: HFAA (B), WA BBR—+ DFA, A BMP 构造 一 个 新 的 PDA R， 它 能 够 识别 属于 B 和 
P 的 语言 的 交集 ; 然后 测试 R 的 语言 是 否 为 空 ; 如 果 该 语言 为 空 ， 则 拒绝 ， 否 则 ， 接 受 。 
下 面 的 过 程 将 判定 AMBTITGNA 。 对 于 给 定 的 NFA N， 可 以 设计 一 个 DFA D 来 模拟 N， 当 且 仅 当 
六 沿 着 两 个 不 同 计算 分 支 接受 某 串 时 ，D 接受 该 串 。 然 后 用 Eprs 的 判定 器 来 确定 D 是 否 接 受 所 有 
的 串 。 

构造 D 的 方法 类 似 于 在 定理 1. 19 的 证 明 中 从 NFA 到 DFA 的 变换 过 程 。 我 们 通过 在 每 个 活 
动 状 态 上 摆 放 小 石子 的 方法 来 模拟 N。 首 先 ， 在 初始 状态 以 及 与 初始 状态 沿 。 转移 可 到 达 的 状态 
上 摆 放 一 个 红色 的 石子 ， 然 后 按照 N 的 变迁 过 程 ， 移 动 、 添 加 、 去 掉 石子 ， 并 保持 这 些 石子 的 颜 
色 。 不 论 何 时 ， 只 要 有 两 个 或 两 个 以 上 的 石子 移动 到 同一 状态 上 ， 就 把 这 些 石子 换 为 蓝 色 的 。 当 
读 完 输入 后 ， 如 果 是 蓝 色 的 石子 在 NN 的 接受 状态 ,或 者 有 红色 石子 在 N 的 两 个 不 相同 的 接受 状 
态 上 ， 则 接受 。 


4. 28 


4. 30 


4. 32 
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DFA D 的 状态 对 应 于 石子 的 每 种 可 能 的 位 置 。 对 于 N， 每 个 状态 都 有 三 种 可 能 : 其 上 所 放 的 
是 红色 石子 、 蓝 色 石 子 或 是 没有 石子 ， 因此， 如 果 N 有 nn 个 状态 的 话 ，D 将 有 3" 个 状态 。 我 们 
定义 了 它 的 初始 状态 、 接 受 状 态 和 转移 函数 来 实现 模拟 。 
参考 问题 2. 30， 如 果 C 是 上 下 文 无 关 语 言 且 尺 是 正则 语言 ， 那 么 CI 门 尺 是 上 下 文 无 关 的 。 因 此 
1 L(G) 是 上 下 文 无 关 的 。 下 面 的 图 灵机 判定 这 个 问题 的 语言 。 
“对 于 输入 (G): 

1. 构造 CFG H, 使 得 L(H)=1" LG). 

2. 用 定理 4.7 中 Ecro 的 判定 器 R 测试 是 否 L(H)==2，。 

3. MR R 接受 ， 则 拒绝 ; 如 果 R 拒绝 ， 则 接受 。” 
下 面 的 图 灵机 判定 A 
“对 于 输入 (M): 

1. 构造 一 个 DFA O 接受 每 个 包含 奇数 个 1 的 串 。 

2. 构造 DFA B, $14 LC(OB)=LCM) NLO). 

3. 使 用 定理 4.4 中 Era WIER T WRES LB= Ø. 

4. 如 果 TRS, WHE; 如 果 工 拒绝 ， 则 拒绝 。” 
下 面 的 图 灵机 工 可 判定 INFINITEbra。 
T 一 “对 于 输入 (A), itib A 是 一 个 DFA: 
. 令 & 是 A 的 状态 数 。 
. 构造 一 个 DFA 刀 ， 接 受 所 有 长 度 不 小 于 & 的 串 。 
. 构造 一 个 DFA M， 使 得 L(M)=L(A) N LD). 
. 使 用 定理 4.4 Ep FE HET, Wik LCM = 人。 
. 如 果 工 接受 ， 则 拒绝 ; MR TBH, WHE.” 
这 个 算法 是 可 行 的 ， 因 为 可 以 接受 无 限 多 个 串 的 DFA 必定 可 以 接受 任意 长 的 串 。 因 此 该 算法 
能 够 接受 这 样 的 一 些 DFA. RZ, Wk RAR DFA 的 状态 数 ， 则 如 果 该 算法 接受 一 个 DFA， 那 么 此 
DFA 可 接受 长 度 为 & 或 大 于 & 的 串 。 而 这 个 串 也 许 能 够 用 正则 表达 式 的 泵 引 理 所 抽出 ， 从 而 获得 
无 限 多 个 接受 的 串 。 
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可 归 约 性 





在 第 4 章 已 经 确定 采用 图 灵机 作为 通用 计算 机 的 模型 ， 并 介绍 了 几 个 在 图 灵机 上 可 解 
的 问题 ， 还 给 出 了 一 个 计算 上 不 可 解 的 问题 ， 即 Ar 。 本 章 讨 论 另 外 几 个 不 可 解 问题 。 在 
讨论 过 程 中 ， 将 介绍 一 个 基本 方法 ， 可 用 来 证 明 问 题 是 计算 上 不 可 解 的 ， 这 个 方法 称 为 可 
归 约 性 (reducibility) 。 

归 约 (reduction) 旨 在 将 一 个 问题 转化 为 另 一 个 问题 ， 且 使 得 可 以 用 第 二 个 问题 的 解 
来 解 第 一 个 问题 。 在 日 党 生活 中 ， 虽 然 不 这 样 称 呼 ， 但 时 常会 遇 到 可 归 约 性 问题 。 

例如 ， 在 一 个 新 城市 中 认 路 ， 如 果 有 一 张 地 图 ， 事 情 就 容易 了 。 这 样 ， 就 将 城市 认 路 
问题 归 约 为 得 到 地 图 问题 。 

可 归 约 性 总 是 涉及 两 个 问题 ， 称 之 为 A 和 B。 如 果 A 可 归 约 到 B， 就 可 用 B 的 解 来 
解 A。 在 上 述 例子 中 ，A 是 城市 认 路 问题 ，B 是 得 到 地 图 问题 。 注 意 ， 可 归 约 性 说 的 不 是 
怎样 去 解 A 或 B， 而 是 在 知道 B 的 解 时 怎么 去 解 A。 

下 面 是 可 归 约 性 的 更 深入 的 例子 。 从 波士顿 到 巴黎 的 旅行 问题 可 归 约 到 买 这 两 个 城市 
则 的 飞机 票 问 题 ， 进 而 又 可 归 约 到 挣 得 买 飞 机 票 的 钱 问题 。 此 问题 还 可 归 约 到 找 工作 
问题 。 

数学 问题 中 也 有 可 归 约 性 。 例 如 ， 测 量 一 个 矩形 的 面积 问题 可 归 约 到 测量 它 的 长 和 宽 
问题 ， 解 线性 方程 组 问题 可 归 约 到 求 矩 阵 的 逆 问 题 。 

当 根 据 可 判定 性 来 对 问题 进行 分 类 时 ， 可 归 约 性 起 着 重要 作用 。 在 本 书 的 后 面 ， 它 也 
在 复杂 性 理论 中 起 着 重要 的 作用 。 当 A 可 归 约 到 B t, 解 A 不 可 能 比 解 B 更 难 ， 因 为 B 
的 一 个 解 给 出 了 A 的 一 个 解 。 根 据 可 计算 性 理论 ， 如 果 A 可 归 约 到 B， 且 B 是 可 判定 的 ， 
WA 也 是 可 判定 的 。 等 价 地 ， 如 果 A 是 不 可 判定 的 ， 且 可 归 约 到 B， 则 B 也 是 不 可 判定 
的 。 后 者 在 证 明 许 多 问题 的 不 可 判定 性 时 起 着 关键 作用 。 

简单 地 说 ， 下 面 方法 可 用 来 证 明 一 个 问题 是 不 可 判定 的 : 先 证 明 另 外 一 个 问题 是 不 可 
判定 的 ， 再 将 此 问题 归 约 到 它 。 


5.1 语言 理论 中 的 不 可 判定 问题 


ATfM 是 不 可 判定 的 ， 即 确定 一 个 图 灵机 是 否 接受 一 个 给 定 的 输入 问题 是 不 可 判定 的 。 
下 面 考虑 一 个 与 之 相关 的 问题 ，HALTrm， 即 确定 一 个 图 灵机 对 给 定 的 输入 是 否 停 机 GH 
过 接受 或 拒绝 ) 问题 。 这 个 问题 被 称 为 停机 问题 (halting problem)。 若 将 Am JAA FH 
HALTrm， 就 可 利用 Arm 的 不 可 判定 性 来 证 明 停 机 问题 的 不 可 判定 性 。 设 

HALTTM 二 {《(M,w)|M 是 一 个 图 灵机 ,和 且 对 输入 ww 停机 )》 

HALTrm 是 不 可 判定 的 。 

证 明 思路 ”用 反 证 法 。 假 设 HALTrm 是 可 判定 的 ， 下 面 用 这 个 假设 来 证 明 AMET 
判定 的 ， 这 与 定理 4. 9 矛盾。 关键 步骤 是 证 明 Atm 可 归 约 到 HALT. 

假设 图 灵机 R 判定 HALT ™. AAR 可 以 构造 一 个 判定 A 的 图 灵机 S。 为 了 感受 
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构造 S 的 方法 ， 假 设 你 就 是 S， 你 的 任务 是 判定 Arx。 当 给 你 一 个 形 如 《〈M,w》 的 输入 
时 ， 如 果 M 接受 w， 你 必须 输出 接受 ; WR M 进入 循环 或 拒绝 凤 ， 你 必须 输出 拒绝 。 当 
你 在 w 上 试 着 模拟 M 时 ， 如 果 它 接受 或 拒绝 ， 你 可 以 照 着 做 。 但 是 你 不 能 确定 M 是 否 在 
循环 ， 并 且 当 M 循环 时 ， 你 的 模拟 将 不 会 终止 。 这 下 坏 了 ， 因 为 你 是 一 个 判定 项 ， 因 此 
不 允许 循环 。 故 这 个 思路 行 不 通 。 

现在 换 用 “有 个 判定 五 ALTTrw 的 图 灵机 R” 这 个 假设 。 使 用 尺 ， 你 可 以 检查 M 对 也 
是 否 停机 。 如 果 尺 指出 M Mw AGL, MOEA, AA (Mow) 不 在 Arm 中 。 如 果 民 指 
出 M 对 w 确实 停机 ， 你 就 模拟 它 ， 而 不 会 有 和 死 循环 的 危险 。 

这 样 ， 如 果 图 灵机 R 存在， 就 能 判定 Arm, CAM Ar 是 不 可 判定 的 。 由 此 予 
盾 即 可 得 到 “R 不 存在 ”这 个 结论 ， 从 而 HALT MBA AE. 

证 明 ”为 得 到 矛盾 ， 假 设 图 灵机 尺 判 定 互 ALTrx， 由 之 可 以 构造 图 灵机 S 来 判定 
Armm, HEU TF: 

SS 一 “在 输入 (M, w) 上 ， 此 处 (Mow) 是 图 灵机 M AB w 的 编码 : 

1. 在 输入 《M,w〉 上 运行 图 灵机 R。 

2. WR R 拒绝 ， 则 拒绝 。 

3. WR R 接受 ， 则 在 w 上 模拟 M， 直 到 它 停 机 。 

4. 如 果 M 已 经 接受 ， 则 接受 ; WR M 已 经 拒绝 ， 则 拒绝 。” 

TA, WÈ R AE HALT, Mj S 判定 Ar 。 因 为 Arw 是 不 可 判定 的 ， 故 HALT 
也 必定 是 不 可 判定 的 。 a 

定理 5. 1 说 明了 证 明 问 题 的 不 可 判定 性 的 方法 ， 此 方法 对 大 多 数 不 可 判定 性 证 明 都 适 
用 ， 只 是 除了 Ar 本 身 的 不 可 判定 性 证 明之 外 ， 它 是 由 对 角 化 方法 直接 证 明 的 。 

为 进一步 使 用 可 归 约 性 方法 来 证 明 不 可 判定 性 ， 现 在 介绍 另外 一 些 定 理 及 相应 的 证 
明 。 设 

ETM 一 {((M)|M 是 一 个 图 灵机 ， 且 工 CM) 王 他) 

ErM 是 不 可 判定 的 。 

证 明 思 路 ”使 用 定理 5. 1 的 反 证 法 ， 设 法 推导 出 矛盾 。 假 设 Erm 是 可 判定 的 ， 以 此 来 
证 明 Atrm 是 可 判定 的 一 一 矛盾 。 设 R 是 判定 ETx 的 一 个 图 灵机 ， 考 虑 怎样 用 R 来 构造 判 
定 Artv 的 图 灵机 S。 当 S 收 到 输入 (Mw) 时 ， 它 应 该 怎样 运行 呢 ? 

构造 S 的 一 个 想法 是 : ERMA M) 上 运行 R 且 看 它 是 否 接受 。 如 果 是 ， 则 知道 
L(M) 是 空 集 ， 因 此 也 就 知道 M 不 接受 w。 如 果 R 拒绝 (M)， 则 能 知道 的 所 有 事情 只 是 
L(M) 不 空 ， 即 M 接受 某 个 串 ， 但 还 是 不 能 知道 M 是 否 接 受 这 个 特定 的 串 w。 故 需要 新 
的 方法 。 

现在 不 在 “M〉 上 运行 R， 取 而 代 之 的 是 在 〈“M〉 的 一 个 修改 型 上 运行 R。 先 修改 
(M), EHRT ww 之 外 ，M 对 所 有 串 都 拒绝 ; 但 在 输入 w 上 ， 它 如 常 运 行 。 现 在 ， 此 修 
改 型 所 能 识别 的 唯一 的 串 就 是 w， 故 它 的 语言 不 空当 且 仅 当 它 接受 w。 然 后 再 用 R 来 测定 
这 个 修改 型 是 否 识别 空 语言 。 为 此 ， 向 R 提供 那个 修改 型 机 器 的 描述 ， 如 果 它 接受 ， 则 此 
修改 型 机 器 不 接受 任何 串 ， 因 而 M 也 就 不 接受 包 

证 明 ” 先 用 标准 术语 来 写 在 证 明 思 路 中 描述 的 那个 修改 型 机 句 Mi 。 

Mi 一 在 输入 工 上 : 
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1. 如 果 xX 关 w， 则 拒绝 。 
2. WR r=w, MEMWA ww 上 运行 M， 当 M 接受 时 ， 就 接受 。” 

这 个 机 器 以 也 作为 它 的 描述 的 一 部 分 。 检 查 z 王 也 是 否 成 立 的 方法 很 显然 ， 即 扫描 输 
人 和 并且 一 个 字符 一 个 字符 地 将 它 与 w 进行 比较 ， 就 可 确定 它们 是 否 相 同 。 

再 假设 图 灵机 R YJE Erm. W FEFE Arx 的 图 灵机 S: 

S=“ 在 输入 〈‘M,w〉 上 ， 此 处 ‘M,w〉 是 图 灵机 M AB w 的 编码 : 

l 用 M 和 ww 的 描述 来 构造 上 述 图 灵机 Mi。 
2. EMA (Mı) EZI R. 
3. 如 果 R 接受 ， 则 拒绝 ; WR R 拒绝 ， 则 接受 。” 

注意 ，S 必须 真 的 能 够 从 M Aw 的 描述 来 计算 Mi 的 描述 。 它 也 确实 能 够 做 到 ， 这 是 
AA: 只 要 在 M 中 增加 一 个 额外 的 状态 来 执行 zx 二 w 的 检查 即 可 。 

如 果 R 是 tm 的 判定 器 ， 则 S 就 是 Ar 的 判定 器 。 而 ATtm 的 判定 器 是 不 存在 的 ， 故 
我 们 知道 Erm 必 定 是 不 可 判定 的 。 县 

另 一 个 与 图 灵机 有 关 的 计算 问题 也 很 有 意思 ， 该 问题 是 : 给 定 一 个 图 灵机 和 一 个 可 由 某 
个 更 简单 的 计算 模型 识别 的 语言 ， 测 定 此 图 灵机 是 否 识别 此 语言 。 例 如 ， 令 REGULARME 
测定 一 个 给 定 的 图 灵机 是 否 有 一 个 与 之 等 价 的 有 穷 自动 机 问题 ， 则 这 个 问题 与 测定 一 个 给 
定 的 图 灵机 是 否 识别 一 个 正则 语言 的 问题 相同 。 设 

RECULARTM 王 {((M)|M 是 一 个 图 灵机 ， 且 工 COMD) 是 一 个 正则 语言 }》 

REGULARTrM 是 不 可 判定 的 。 

证 明 思 路 ” 像 以 前 不 可 判定 性 定理 的 证 明 一 样 。 这 个 证 明 还 是 使 用 从 Arw 出 发 的 归 约 。 
先 假设 RECULARTrM 是 由 图 灵机 尺 判 定 的 ， 再 用 这 个 假设 构造 一 个 判定 Arw 的 图 灵机 S。 现 
在 不 明显 的 是 : 怎样 使 用 尺 来 帮助 S 实现 它 的 任务 。 虽 然 不 明显 ， 但 还 是 能 够 做 到 。 

构造 S 的 思路 是 : 先 取 S 的 输入 为 “M,w)， 再 修改 M 使 得 修改 后 的 图 灵机 识别 一 个 
正则 语言 ， 当 且 仅 当 M 接受 w。 称 此 修改 后 的 图 灵机 为 Me. wit Me 使 得 : 4 M 不 接受 
w 时 ， 它 识别 非 正 则 语言 {0"1"|n>0}; 5 M 接受 w 时 ， 它 识别 正则 语言 2* 。 必 须 说 明 
S 是 怎样 从 M 和 ww 来 构造 Ms 的 。 方 法 是 : M 自动 接受 所 有 在 (0"1"|n>0) PHB, A 
外 ， 如 果 M 还 接受 w， 则 M: 就 接受 所 有 其 他 的 串 。 

注意 ， 构 造 图 灵机 Ms 的 目的 并 不 是 为 了 在 某 个 输入 上 实际 地 运行 一 一 一 个 常见 的 错 
误 混 消 。 构 造 Me 仅仅 是 为 了 将 Ms 的 描述 输入 给 假设 存在 的 REGULARTM 的 判定 器 。 一 
且 这 个 判定 器 返回 它 的 答案 ， 那 么 就 能 根据 这 个 答案 判断 M 是 否 接受 w。 这 样 就 判定 了 
Ar, ETA IE. 

WEAR 设 尺 是 判定 RECULARTw 的 一 个 图 灵机 ， 下 面 构造 判定 Arm 的 图 灵机 S. SH 
运行 方式 如 下 : 

S=“ FAA (M,w), HAY M 是 图 灵机 ，z 是 串 : 

1. 构造 下 述 图 灵机 Ms: : 
M2 = ‘ERA x LE: 
a WR z 具有 形式 01", WHE. 
b. 如 果 工 不 具有 此 形式 ， 则 在 输入 w 上 运行 M。 若 M 接受 ww， 则 接受 。? 
2. 在 输入 〈Mz》 上 运行 R。 
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3. WR R 接受 ， 则 接受 ; 如 果 R 拒绝 ， 则 拒绝 。” u 

可 类 似 地 证 明 ， 检 查 一 个 图 灵机 的 语言 是 不 是 下 列 语言 都 是 不 可 判定 的 ， 上 下 文 无 关 
语言 、 可 判定 语言 甚至 有 限 语言 。 事 实 上， 关于 这 个 问题 有 一 个 更 一 般 性 的 结果 ， 称 为 赖 
斯 定理 (Rice's theorem), Etat: 测定 语言 的 任何 一 个 性 质 是 否 可 由 图 灵机 识别 都 是 不 
可 判定 的 。 问 题 5. 16 给 出 了 赖 斯 定理 。 

到 目前 为 止 ， 证 明 语 言 的 不 可 判定 性 所 用 的 方法 都 是 从 ATm 出 发 的 归 约 。 但 在 证 明 某 
些 语言 的 不 可 判定 性 时 ， 从 另外 一 个 不 可 判定 语言 (如 Erm) 出 发 进行 归 约 有 时 候 更 加 方 
便 。 定理 5.4 证 明 ， 检查 两 个 图 灵机 的 等 价 性 是 一 个 不 可 判定 的 问题 。 当 然 ， 可 以 使 用 从 
ATfrx 出 发 的 归 约 来 证 明 它 ， 但 下 面 给 出 一 个 从 Er 出 发 的 归 约 ， 作 为 证 明 不 可 判定 性 的 另 

一 类 型 的 例子 。 设 
EQrm ={(Mı M2) |M: 和 Ms 都 是 图 灵机 , 且 工 (MI ) 一 工 (M2 )) 

EQTrM 是 不 可 判定 的 。 

证 明 思 路 假设 EQrx 是 可 判定 的 。 如 果 能 给 出 从 Er 2 EQrv 的 归 约 ， 就 证 明了 
FETM 也 是 可 判定 的 。 构 造 这 个 归 约 的 思路 很 简单 ，Erw 是 检查 一 个 图 灵机 的 语言 是 否 为 空 的 
问题 。EQrm 是 测定 两 个 图 灵机 的 语言 是 否 相 同 的 问题 。 如 果 两 个 语言 中 碰巧 有 一 个 为 空 ， 
只 要 测定 男 一 个 机 器 的 语言 是 否 为 空 即 可 ， 即 问题 Er 。 故 当 两 个 机 器 中 有 一 个 是 用 来 识别 
空 语言 时 ， 问 题 Erm 就 是 问题 EQrw 的 一 个 特例 。 这 个 想法 使 得 构造 归 约 变 得 很 容易 。 

证 明 设 图 灵机 R 判定 EQrm。 如 下 构造 判定 Erm 的 图 灵机 S: 

S 二 “对 于 输入 《MM);， 其 中 M 是 图 灵机 : 

1. 在 输入 〈“M，Mi1〉 上 运行 R， 其 中 Mi 是 拒绝 所 有 输入 的 图 灵机 。 
2. WR R 接受 ， 则 接受 ; 如 果 R 拒绝 ， 则 拒绝 。” 

WR RFE EQ™m™, WS 判定 rm。 但 由 定理 5.2，ETrM 是 不 可 判定 的 。 故 EQm th 

必定 是 不 可 判定 的 。 z 


利用 计算 历史 的 归 约 


计算 历史 方法 是 证 明 ATm 可 归 约 到 某 些 语言 的 重要 技术 。 在 证 明 某 个 问题 的 不 可 判定 
性 时 ， 如 果 此 问题 涉及 检查 某 样 东 西 的 存在 性 ， 则 此 方法 常常 很 有 用 。 例 如， 此 方法 曾 用 
来 证 明 希 尔 伯 特 第 10 问题 的 不 可 判定 性 。 希 尔 伯 特 第 10 问题 是 检查 一 个 多 项 式 的 整数 根 
的 存在 性 。 

图 灵机 在 输入 上 的 计算 历史 就 是 当 这 个 图 灵机 处 理 此 输入 时 所 经 过 的 格局 序列 。 它 是 
这 个 机 需 所 经 历 的 计算 的 完整 记录 。 

设 M 是 一 个 图 灵机 ，w 是 一 个 输入 串 。M 在 w 上 的 一 个 接受 计算 历史 
(accepting computation history) 是 一 个 格局 序列 Cl ,Cz，…，C， 其 中 Ci £MEw 上 的 
起 始 格 局 ，C 是 M 的 一 个 接受 格局 ， 且 每 个 Ci 都 是 Ci-1 的 合法 结果 ， 即 符合 M 的 规则 。 
M 在 w 上 的 一 个 拒绝 计算 历史 (rejecting computation history) THEMEN, REC ME 
一 个 拒绝 格局 。 

计算 历史 都 是 有 限 序 列 。 如 果 M 在 w 上 不 停机 ， 则 M Ew 上 既 没 有 接受 也 没有 拒绝 
计算 历史 存在 。 确 定型 机 器 在 任何 给 定 的 输入 上 最 多 只 有 一 个 计算 历史 。 非 确定 型 机 器 即 
使 在 单个 输入 上 也 可 能 有 多 个 计算 历史 ， 它 们 与 各 个 计算 分 支 相 对 应 。 但 在 目前 ， 我 们 继 
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续 将 注意 力 集中 在 确定 型 机 器 。 使 用 计算 历史 方法 的 第 一 个 例子 是 ,证明 所 谓 的 线性 界限 
自动 机 的 不 可 判定 性 。 

线性 界限 自动 机 (linear bounded automaton, LBA) 是 一 种 受到 限制 的 
图 灵机 ， 它 不 允许 其 读 写 头 离开 包含 输入 的 带子 区 域 。 如 果 此 机 器 试图 将 它 的 读 写 头 移出 
输入 的 两 个 端点 ， 则 读 写 头 就 保持 在 原 地 不 动 。 这 与 普通 图 灵机 的 读 写 头 不 会 离开 带子 的 
左 端点 的 方式 一 样 。 

线性 界限 目 动 机 是 只 有 有 限 存 储 的 图 灵机 ， 如 图 5- 1 所 示 。 它 只 能 解 这 样 的 问题 ， 其 
所 需要 的 存储 不 得 超过 用 作 输 入 的 带子 区 域 。 使 用 一 个 比 输入 字母 表 要 大 一 些 的 带子 字母 
表 ， 就 能 使 得 可 用 存储 增加 到 常数 倍 。 也 就 是 说 ， 对 于 长 度 为 n 的 输入 ， 可 用 存储 量 关 于 
n 是 线性 的 。 这 就 是 此 模型 的 名 称 的 由 来 。 

尽管 线性 界限 自动 机 的 存储 受到 限制 ， 但 它 仍然 十 分 强 
K. Bild, Anra, Acre, Epra 和 Ecrc 的 判定 器 都 是 LBA. 控制 器 


每 个 CFL 都 可 由 一 个 LBA 来 判定 。 事 实 上 ， 要 提出 一 个 不 bisa 
能 由 LBA 来 判定 的 可 判定 语言 还 需 颇 费 一 番 周 折 。 只 有 到 j 
第 9 章 时 ， 才 能 介绍 一 个 可 以 做 到 这 一 点 的 技术 。 图 5-1 SEF REHA SSL EY Bl as 


设 Aiesa ÆI E LBA 是 否 接受 它 的 输入 的 问题 。 尽 管 ALsA 与 不 可 判定 问题 Ar EAI 

灵机 被 限制 为 LBA 时 是 相同 的 ， 我 们 还 是 可 以 证 明 ALesA 是 可 判定 的 。 设 
Arpa={(M,w)|M £—-* #X $ w 的 LBA} 

在 证 明 ALsa 的 可 判定 性 之 前 ， 证 明 下 面 的 引 理 是 有 用 的 。 它 指出 : 当 一 个 LBA 的 输 
人 是 一 个 长 度 为 n 的 串 时 ， 只 能 有 有 限 多 个 格局 。 

设 M 是 有 g 个 状态 和 g 个 带子 符号 的 LBA。 对 于 长 度 为 nn 的 带子 ，M 恰 
有 qng” 个 不 同 的 格局 。 

证 明 M 的 格局 就 像 计 算 中 间 的 一 个 快照 。 格 局 由 控制 状态 、 读 与 头 位 置 和 带子 
内 容 组 成 。 这 里 ，M 有 gq 个 状态 。 它 的 带子 长 度 是 wn， 所 以 读 写 头 可 能 处 于 个 位 置 
之 一 ， 且 g" 个 带子 符号 串 可 能 出 现在 带子 上 。 此 三 个 量 的 乘积 就 是 带 长 为 n 的 M 的 
格局 总 数 。 a 

ALBA 是 可 判定 的 。 

证 明 思 路 ”为 了 判定 LBA M 是 否 接 受 输入 w， 在 ww 上 模拟 MM。 在 模拟 过 程 中 ， 如 果 
M 停机 且 接 受 或 拒绝 ， 则 相应 地 接受 或 拒绝 。 如 果 M 在 w 上 循环 ， 困 难 就 出 现 了 。 只 有 
知道 已 进入 循环 时 ， 才 能 停机 且 拒 绝 。 

调查 M 何 时 陷入 循环 的 思路 是 : 当 M 在 w 上 计算 时 ， 它 从 一 个 格局 进入 男 一 个 格 
局 。 如 果 M 曾经 重复 过 一 个 格局 ， 它 将 继续 一 再 地 重复 这 个 格局 ， 因 此 就 陷入 了 循环 。 
因为 M 是 一 个 LBA， 故 可 利用 的 带子 方 格 的 数量 是 有 限 的 。 由 引 理 5.7， 在 这 个 有 限量 
的 带子 上 ，M 只 可 能 处 于 有 限 多 个 格局 中 。 所 以 ， 要 使 M 不 进入 曾经 进入 过 的 任何 格局 ， 
就 只 有 有 限 多 个 格局 可 以 选择 。 引 理 5. 7 给 出 了 所 能 选择 的 最 大 格局 数 &， 通 过 在 M ER 
拟 & 步 ， 就 能 知道 M 是 否 进 入 了 循环 。 如 果 到 那 时 M 还 没有 停机 ， 它 肯定 陷入 了 循环 。 

证 明 判定 ALpA 的 算法 如 下 : 

了 一 “对 于 输入 (M,w), HE M È LBA, wÆ: 

1. 在 w 上 模拟 M gng” 步 ， 或 者 直到 它 停机 。 


GIF FT J 4% i 141 


2. WR M 停机 ， 则 当 它 接受 时 接受 ， 拒绝 时 拒绝 。 如 果 它 还 没有 停机 ， 就 拒绝 。” 

如 果 M 在 w 上 运行 gng” 步 还 没有 停机 ， 根 据 引 理 5.7， 它 必定 在 重复 某 个 格局 ， 即 
陷 人 了 循环 。 这 就 是 算法 为 什么 在 此 情形 下 拒绝 的 原因 。 a 

定理 5. 8 说 明了 LBA 和 图 灵机 有 一 个 本 质 的 不 同 : 对 LBA， 接 受 问 题 是 可 判定 的 ， 
但 对 图 灵机 来 说 却 不 是 。 然 而 涉及 LBA 的 另外 一 些 问题 仍 是 不 可 判定 的 ， 其 中 之 一 是 空 
性 质问 题 ， 即 Erea =M) |M E—A LBA, HL(M)=Ø}. HWE Erra ÆA T FE K, 
要 用 计算 历史 方法 给 出 一 个 归 约 。 

ELBA 是 不 可 判定 的 。 

证 明 思 路 证明 使 用 从 Ar HARA. BE: 如 果 Erpa 是 可 判定 的 ， 则 Ar 也 
是 可 判定 的 。 现 在 假设 ELpa 是 可 判定 的 ， 怎 么 使 用 这 个 假设 来 判定 Arm VE? 

对 于 图 灵机 M 和 输入 串 w， 通 过 构造 一 个 LBA B， 再 检查 L(B) 是 否 为 空 ， 就 可 确 
定 M 是 否 接受 w。B 识别 的 语言 包含 了 M 在 w 上 的 所 有 接受 计算 历史 。 如 果 M 接受 记 ， 
这 个 语言 就 包含 一 个 串 ， 因 此 是 非 空 的 。 如 果 M 不 接受 双 ， 这 个 语言 就 是 空 的 。 如 果 人 能 
确定 B 的 语言 是 否 为 空 ， 显 然 就 能 确定 M 是 否 接受 w 

现在 描述 怎样 从 M A w 构造 B。 注 意 ， 不仅 需要 证 明 B 的 存在 性 ， 还 必须 证 明 一 个 
图 灵机 如 何 从 给 定 的 M 和 w 的 描述 产生 B 的 描述 。 

如 同 前 面 给 出 的 不 可 判定 性 证 明 中 的 归 约 ， 构造 B 的 目的 是 为 了 将 B 的 描述 输入 给 
假设 存在 的 ELsa 的 判定 器 ， 而 不 是 在 某 个 输入 上 运行 它 。 

设 + 是 M 在 w 上 的 一 个 接受 计算 历史 ， 构造 B， 使 之 接受 输入 x。 回忆 一 下 ，M 的 
一 个 接受 计算 历史 是 M 在 接受 某 个 串 w 时 经 历 的 格局 序列 C1 ,C2,，…,C:。 出 于 证 明 的 需 
T, MRS RA PRAMAS, BAS +A AP. OR 5-2 所 示 。 


F G a # --- # a 
es 


CG Cs Cy Cı 
图 5-2 B 的 一 个 可 能 的 输入 


LBA B 按 如 下 方式 运行 。 如 果 工 是 M Ew 上 的 一 个 接受 计算 历史 ， 则 当 B 收 到 输入 
ZX 时， 应 该 接受 。 首 先 ，B 根据 分 界 符 将 z 分 解 为 串 C1,Cz,，…,C:。 然 后 B 检查 C; 是 否 
满足 接受 计算 历史 的 三 个 条 件 : 

LQ 是 M 在 w 上 的 起 始 格 局 。 

2. 每 个 Ciri 都 是 Ci 的 合法 结果 。 

3. GÆ M 的 一 个 接受 格局 。 

M 在 w 上 的 起 始 格局 Ci 应 该 是 串 gww w, HP gq 是 M 在 w 上 的 起 始 状态 。 
这 个 串 是 直接 装 在 B 中 的 ， 所 以 B 能 够 检查 第 一 个 条 件 。 接 受 格 局 是 包含 状态 accept HH 
局 ， 所 以 B 只 要 通过 扫描 Ci 看 能 否 找 到 gp:， 就 可 检查 第 三 个 条 件 。 第 二 个 条 件 的 检查 
是 最 困难 的 ， 对 每 对 相 邻 的 格局 ，B 要 检查 Ci+1 是 否 为 Ci 的 合法 结果 。 这 个 步骤 包括 : 
除了 Ci 中 读 写 头 下 的 位 置 及 其 相 邻 位 置 外 ， 验 证 Ci 和 Ci+1 是 相同 的 ， 而 上 述 几 个 位 置 
必须 根据 转移 函数 来 更 新 。B 通过 在 C; 和 Ci+1 的 相应 位 置 间 来 回 移动 ， 验 证 更 新 是 否 适 
当 。 为 了 在 来 回 移动 时 记录 当前 位 置 ，B 用 点 在 带子 上 标记 当前 位 置 。 最 后 ， 如 果 条 件 1、 
2 和 3 都 满足 ， 则 B 接受 输入 。 

将 判定 器 的 答案 反 过 来 ， 就 能 得 到 M 是 否 接受 w 的 答案 。 这 样 就 判定 了 Am, Ke 
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证 明 现在 构造 从 Armë Ersa 的 归 约 。 假 设 图 灵机 R 判定 Lpa。 如 下 构造 判定 Arm 
的 图 灵机 S: 

S=“ FA (Mow), RP MERRI, wÆ: 

1. 如 在 证 明 思 路 中 所 描述 的 那样 从 M Al w 构造 LBA B., 
2. 在 输入 “〈B》 上 运行 及。 
3. 如 果 R 拒绝 ， 则 接受 ; 如 果 尺 接受 ， 则 拒绝 。 

如 果 尺 接受 “B);， 则 L(B)= 二 名 。 这 样 ，M 在 w 上 就 没有 接受 计算 历史 ，M 也 就 不 
接受 w。 因 此 ，S 就 拒绝 (M, w), X WH, 
如 果 尺 拒绝 (B), M B 的 语言 不 空 。B 能 够 
RSW ME BE M 在 w 上 的 接受 计算 历史 。 
这 样 ，M 必定 接受 w。 相 应 地 ，S 也 就 接受 






el# x)galalb|#|x|x|alb [+]... | 
(M w). E 5- 3 是 检查 这 样 一 个 图 灵机 计算 a aaa a 


= C; Cisi 
历史 的 示意 图 。 am 


使 用 计算 历 中 的 归 约 技术 。 还 能 建立 有 美国 后 3 RS TARR LBA B 
上 下 文 无 关 文 法 和 下 推 自动 机 问题 的 不 可 判定 性 。 回 忆 一 下 ， 定 理 4.7 介绍 了 一 个 算法 来 
判定 一 个 上 下 文 无 关 文 法 是 否 派生 串 ， 即 判定 工 (G) = 名 是 否 成 立 。 与 此 相关 ， 现 在 要 证 
明 问 题 “ 测 定 一 个 上 下 文 无 关 文 法 是 否 派生 所 有 可 能 的 串 ” 是 不 可 判定 的 。 证 明 这 个 问题 
不 可 判定 是 证 明 上 下 文 无 关 文法 等 价 性 问题 不 可 判定 的 重要 步 又。 设 

ALLcrg = ((G) |G 是 一 个 CFG E L(G)=5*)} 

ALLcrG 是 不 可 判定 的 。 

WEAR 用 反 证 法 。 为 得 到 矛盾 ， 假 设 ALLcrc 是 可 判定 的 ， 用 这 个 假设 来 证 明 Arm Æ 
可 判定 的 。 其 证 明 与 定理 5. 9 的 证 明 类 似 ， 只 是 稍微 复杂 一 些 ， 绕 了 一 点 点 弯 。 这 是 一 个 
从 Arw 出 发 利用 计算 历史 的 归 约 。 但 由 于 技术 上 的 原因 ， 对 计算 历史 的 表示 做 了 些 修改 ， 
后 面 将 解释 这 样 做 的 原因 。 

现在 来 描述 怎样 运用 ALLcrc 的 判定 过 程 来 判定 Ar 。 对 于 图 灵机 M ARBAB w, É 
先 构造 一 个 CFG G， 使 得 它 派生 所 有 串 当 且 仅 当 M 不 接受 w。 所 以 ， 如 果 M 接受 w， 则 
存在 一 个 特别 的 串 ，G 不 派生 它 。 这 个 串 应 该 是 一 一 猜 猜 看 一 一 M 在 ww 上 的 接受 计算 历 
史 。 即 设计 G， 使 之 派生 所 有 不 是 M 在 w 上 接受 计算 历史 的 串 。 

为 了 使 得 CFG G 派生 所 有 不 是 ME 岂 上 接受 计算 历史 的 串 ， 采 用 下 面 的 策略 。 一 个 串 不 
能 成 为 接受 计算 历史 的 原因 可 能 有 多 个 。 将 M 在 w 上 的 接受 计算 历史 表示 成 间 Ci HOHH 
C#, EF G 是 M 在 双 上 计算 的 第 ; 步 的 格局 。 然 后 G 派 生出 满足 下 述 条 件 的 所 有 串 : 

1 AWC; FR. 

2. 不 以 一 个 接受 格局 结束 。 

3. FEM 的 规则 下 ， 某 个 C; 不 恰好 派生 Citio 

如 果 M 不 接受 凤 ， 就 没有 接受 计算 历史 存在 ， 故 所 有 串 都 因 这 样 或 那样 的 问题 而 不 
能 成 为 接受 计算 历史 ， 因 此 G 将 派生 所 有 串 ， 这 正 是 所 希望 的 。 

现在 来 认真 考虑 G 的 实际 构造 。 不 是 真 的 构造 G， 而 是 构造 一 个 PDA D， 因 为 可 以 
使 用 定理 2. 12 中 的 构造 将 DD 转换 为 一 个 CFG。 这 样 做 是 因为 ， 就 我 们 的 目的 而 言 ， 设 计 
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一 个 PDA 要 比 设计 一 个 CFG 容易 。 以 非 确定 的 分 支 计 算 开 始 ， 猜 测 前 面 的 三 个 条 件 中 
哪 一 个 被 拿 来 检查 。 它 以 一 个 分 支 检查 输入 串 的 开始 部 分 是 否 为 Cl ， 如 果 不 是 ， 则 接受 。 
以 夯 一 个 分 支 检查 输入 串 是 否 以 一 个 包含 接受 状态 q,..。, 的 格局 结束 ， 如 果 不 是 ， 则 接受 。 

第 三 个 分 支 的 作用 是 : 如 果 某 个 Ci 不 恰好 派生 Ci+l1， 就 接受 。 其 工作 方式 如 下 : 首 
先 扫 描 输入 ， 直 到 它 非 确 定性 地 确定 它 已 到 达 Ci 。 第 二 步 ， 它 将 Ci 推进 栈 里 ， 直 至 由 符 
号 # 标 记 的 结尾 。 第 三 步 ， 了 弹出 栈 与 Ci+l 比 较 。 除 了 读 写 头 附近 位 置 外 ， 它 们 应 该 相 
同 。 读 写 头 附近 位 置 的 更 改 应 由 M 的 转移 畏 数 决定 。 最 后 ， 如 果 发 现 不 匹配 或 不 适当 的 
更 改 ，D 就 接受 。 

这 个 思路 存在 的 问题 是 : 4 DH C: 弹出 栈 时 ， 它 处 于 相反 的 顺序 ， 因 而 不 适合 与 
Ci+1 比 较 。 前 面 提 到 的 绕 弯 就 在 此 处 。 换 一 种 方法 来 写 接受 计算 历史 ， 使 得 每 隔 一 个 格局 
就 以 相反 的 顺序 出 现 。 奇 数位 置 保持 向 前 的 顺序 写 ， 但 偶数 位 置 向 后 写 。 这 样 形式 的 一 个 
接受 计算 历史 如 图 5-4 所 示 。 


a —) ££ = ££ > FF S FF ate g # 
Cı CR Cs CR Ci 


图 5-4 每 隔 一 个 格局 就 以 相反 的 顺序 出 现 


Æ PDA D 以 此 修改 后 的 方式 将 格局 推进 栈 ， 则 当 它 们 再 弹出 时 ， 其 顺序 就 适合 与 
下 一 个 格局 进行 比较 了 。D 的 设计 就 是 要 使 得 接受 那些 不 是 接受 计算 历史 的 任何 修改 后 
的 串 。 a 
在 练习 5.1 中 ， 可 以 使 用 定理 5. 10 来 证 明 EQcrc 是 不 可 判定 的 。 


5.2 一 个 简单 的 不 可 判定 问题 


ARS RUE: 不 可 判定 性 现象 不 仅仅 局 限于 自动 机 的 问题 。 我 们 将 给 出 一 个 关于 串 操 
作 的 不 可 判定 问题 ， 称 为 波斯 特 对 应 问题 (Post Correspondence Problem, PCP). 

可 以 很 容易 地 将 这 个 问题 描述 成 一 种 游戏 一 一 多 米 诺 骨牌 。 每 个 骨牌 由 两 个 串 构 成 ， 
=U- t, BP PRALER 


一 能 骨牌 看 起 来 像 


b a ca abc 
{Lea l> Lab] [> [22°] 
任务 是 将 这 些 骨 牌 进行 排列 〈 人 允许 重复 ) ， 使 得 在 阅读 顶部 符号 后 得 到 的 串 与 阅读 底 
部 符号 后 得 到 的 串 相 同 。 这 样 的 排列 称 为 一 个 匹配 (match)。 例 如 ， 下 面 的 排列 就 是 这 个 


游戏 的 一 个 匹配 。 

站 II 
阅读 顶部 后 得 到 串 abcaaabc， 与 阅读 底部 后 得 到 的 相同 。 可 以 将 骨牌 变形 ， 使 得 顶部 和 底 
部 对 应 符号 整齐 地 排列 ， 以 便 更 容易 表示 匹配 。 


j j j ' | 
ja |b le a |ala b e} 


| 
| 


len ble alaia bie! 
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IERE, 不 可 能 找到 这 样 的 匹配 。 例 如 ， 簇 
abc ca acc 
ll 
不 可 能 包含 匹配 ， 因 为 顶部 的 每 个 串 都 比 底部 对 应 的 串 长 。 
波斯 特 对 应 问题 是 : 确定 一 簇 骨 牌 是 否 有 一 个 匹配 。 这 个 问题 在 算法 上 是 不 可 解 的 。 


在 形式 描述 这 个 定理 和 给 出 它 的 证 明之 前 ， 先 来 精确 地 描述 这 个 问题 ， 然 后 表示 成 一 
个 语言 。 骨 有 牌 族 已 是 PCP 的 一 个 实例 : 


li) 
匹配 是 一 个 序列 ii sizesis (EG ti tit; =bi bi tbi 。 问 题 是 确定 P 是 否 有 匹配 。 令 
PCP={(P)|P 是 波斯 特 对 应 问题 的 一 个 实例 , 且 PALE} 

CED PCP 是 不 可 判定 的 。 

证 明 思 路 ”虽然 证 明 有 许多 技术 上 的 细节 ， 但 概念 还 是 简单 的 ， 主 要 技术 是 由 Ar 出 
发 利用 接受 计算 历史 的 归 约 。 证 明 : 从 任意 的 图 灵机 M 和 输入 w 都 能 构造 一 个 实例 P， 
使 得 匹配 都 是 M Ew 上 的 接受 计算 历史 。 这 样 ， 如 果 能 确定 这 个 实例 是 否 有 一 个 匹配 ， 
就 能 确定 M EARS w 

但 是 怎么 构造 P 使 得 匹配 都 是 M Ew 上 的 接受 计算 历史 呢 ? 在 已 中 选择 骨牌 ， 使 得 
每 形成 一 个 匹配 ， 便 模拟 一 次 M。 且 在 匹配 中 ， 每 个 骨牌 都 将 一 个 格局 中 的 一 个 或 多 个 位 
置 与 下 一 个 格局 中 的 相应 位 置 连接 起 来 。 

在 构造 之 前 ， 先 处 理 三 个 小 的 技术 要 点 。( 在 第 一 次 通读 时 ， 不 要 过 于 担心 这 些 。.) 第 
一 ， 为 了 方便 了 的 构造 ， 假 设 M 在 w 上 从 不 试图 将 它 的 读 写 头 移 出 带子 的 左 端点 。 这 要 
求 首 先 改 变 M 以 防止 这 样 的 行为 。 第 二 ， 如 果 w= 二 e， 则 在 构造 中 使 用 串 uU 替 代 w B=, 
修改 PCP， 要 求 匹配 都 从 第 一 个 骨牌 开始 ， 即 : 


tl 

稍 后 将 说 明 怎么 去 掉 这 个 要 求 。 我 们 称 这 个 问题 为 修改 了 的 波斯 特 对 应 问题 (MPCP)。 设 

MPCP={(P>| P 是 波斯 特 对 应 问题 的 一 个 实例 ,P 有 一 个 从 第 一 个 骨牌 开始 的 匹配 } 

现在 进入 证 明细 节 ， 即 设计 P 来 模拟 MM Ew 上 的 动作 。 

证 明 ”假设 图 灵机 R 判定 PCP。 构 造 S 来 判定 ATtv。 令 

M= (Q 525150590 ,qaccept ?dreject ) 

HEH Q, Z, T, S TIEM 的 状态 集 、 输 入 字母 表 、 带 子 字母 表 和 转移 函数 。 

S 构造 PCP 的 一 个 实例 已 ， 使 得 已 有 一 个 匹配 当 且 仅 当 M 接受 w。 为 此 ，S 首先 构 
造 MPCP 的 一 个 实例 P 。 下 面 以 七 个 部 分 来 描述 这 个 构造 ， 每 个 部 分 完成 在 w 上 模拟 
M 的 一 个 特定 方面 。 在 构造 过 程 中 ， 为 了 解释 我 们 正在 做 什么 ， 用 一 个 例子 插 在 构 
造 中 。 

第 1 部 分 : 构造 以 下 列 方式 开始 : 


因为 P 是 MPCP 的 一 个 实例 ， 故 匹配 必须 以 这 张 骨 有 牌 开始 。 底 部 串 以 M 在 w 上 接 
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受 计算 历史 中 的 第 一 个 格局 Ci = qww wn 开始 ， 如 图 5-5 所 示 。 


到 目前 为 止 ， 只 得 到 一 个 部 分 匹配 ， 其 底部 串 由 # qu 。。，， 
ss 


…zun# 井 构成 ， 顶 部 串 只 有 # 。 为 获得 匹配 ， 必 须 扩 展 顶 部 串 
图 5-5 MPCP 匹配 的 开始 





来 匹配 底部 串 。 用 新 骨牌 来 做 这 样 的 扩展 。 这 些 新 的 骨牌 强迫 
模拟 M 的 一 次 单 步 运行 ， 使 得 M 的 下 一 个 格局 出 现在 底部 串 
的 扩展 中 。 

第 2、3 和 4 部 分 在 已 中 增加 的 骨牌 在 模拟 中 起 主要 作用 。 第 2 部 分 处 理 读 写 头 向 右 
运动 ， 第 3 部 分 处 理 读 写 头 向 左 运动 ， 第 4 部 分 处 理 不 与 读 写 头 相 邻 的 带子 方 格 。 

第 2 部 分 : 而 于 十 一 个 as bEr Allg, req, 其 中 IF Greject ? 

yo FR Dga) = (rb, R) M| FE JAA P’ 
第 3 部 分 : 对 于 每 一 个 ae，8，cEFPR 和 qd，rEQ， 其 中 天 qt， 


Wi RR 8(q,a)=(r,b,L) , 则 将 | SOE | 放 入 已 "中 


rcb 
第 4 部 分 对 于 每 一 个 aET, 将 | 2 | 放 入 已 ' 中 。 


现 补充 一 个 虚拟 的 例子 来 说 明 到 目前 为 止 我 们 已 经 构造 了 些 什 么 。 设 ={0,1,2,U)。 
假设 w 是 串 0100，M 的 起 始 状态 是 g。。 在 状态 q 且 读 0 时 ， 假 设 转移 函数 指示 M 进入 
状态 g;， 在 带子 上 写 下 2， 并 将 它 的 读 写 头 向 右 移动 。 即 ，8(g, ,0)==(g, ,2,R)， 

第 1 部 分 将 如 下 骨牌 放 入 PH: 


Pract: FE 


i a 
# qo0 100 # 


另外 ， 因 为 6(q, ,0) 二 (gq; 2 R), B 2 部 分 放置 如 下 上 骨牌: 
| 
因为 0，1，2，L 是 卫 的 成 员 ， 故 第 4 部 分 将 下 列 骨牌 放 人 PP: 
fol [+]: lel] 


这 一 步 与 第 5 部 分 一 起 使 得 匹配 得 到 如 下 扩展 : 


且 匹 配 以 如 下 方式 开始 . 








这 样 ， 第 2、3 和 4 部 分 的 骨牌 使 得 我 们 能 够 通过 “在 第 一 个 格局 之 后 增加 第 二 个 格 
局 ”的 方法 来 扩展 匹配 。 和 布 望 这 个 过 程 能 够 继续 下 去 ， 即 增加 第 三 个 格局 ， 然 后 第 四 个 格 
局 ， 等 等 。 为 此 ， 需 要 增加 一 个 新 的 骨牌 来 复制 符号 # 。 
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第 5 部 分 : 
|S | 和 | | 放 入 已 中 
这 两 个 骨牌 中 的 第 一 个 使 我 们 能 复制 符号 # ， 它 是 分 隔 格局 的 标记 。 第 二 个 骨牌 使 我 
们 能 在 格局 的 未 端 增加 一 个 空白 符 U， 以 此 来 模拟 右边 的 无 限 多 个 空格 ， 这 些 空格 在 写 格 
局 时 被 压缩 了 ， 
接着 上 面 的 例子 ， 假 设 在 状态 g; 且 读 1 时，M 进入 状态 gs ， 在 带子 上 写 下 0， 并 将 读 
写 头 向 右 移动 ， 即 8(q; ,1) 二 (q; ,0,R)。 则 在 P 中 有 骨牌 


最 后 的 那个 匹配 被 扩展 到 





再 假设 在 状态 qs 且 读 0 时 ，M 进入 状态 gq,。， 在 带子 上 写 下 2， 并 将 它 的 读 写 头 向 左 
移动 。 故 6(g; 0) = (dy peels) x 则 有 骨牌 


| Ea [Ht [| 
q,021’ Lq,124’ Lq,22 qy U2 


第 一 个 骨牌 与 本 构造 有 关 ， 因 为 读 写 头 左边 的 符号 是 0。 前 面 的 部 分 匹配 就 被 扩展 成 

















注意 ， 构 造 匹配 就 是 在 w 上 模拟 M， 这 个 过 程 要 一 直 进 行 到 M 到 达 停 机 状态 。 如 果 
出 现 了 接受 状态 ， 则 希望 这 个 部 分 匹配 的 项 部 “ 赶 上 ”底部 ， 从 而 使 得 这 个 匹配 得 以 完 
成 。 为 此 ， 再 增加 如 下 骨牌 。 

第 6 部 分 : 对 于 每 一 个 a€TD， 

将 Shee | 和 [Zent | 放 入 P’ 中 


daccept q accept 


这 个 步骤 的 效果 是 : 在 图 灵机 停机 后 增加 一 些 “ 伪 步 又"”。 这 里 ， 读 写 头 “ 吃 掉 ” 一 
些 邻 近 的 符号 直到 没有 符号 剩 下 。 再 继续 前 面 的 例子 ， 假 设 到 机 需 以 接受 状态 停机 的 地 方 


为 止 的 部 分 匹配 是 
# 


刚才 增加 的 骨牌 允许 匹配 如 下 继续 进行 : 
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= Ss SS SS 
# 2 1 accept Sa 2 # 2 1 { Qaccept | 2 | sea \ 


第 7 部 分 : 最 后 增加 如 下 骨牌 


[2 # | 


# accept # = 

这 就 结束 了 整个 P' 的 构造 。 注 意 P' 是 MPCP hix, m EEI MPCP， 匹 配 
才 模 拟 了 Mw 上 的 计算 。 为 完成 证 明 ， 回 忆 一 下 ，MPCP 与 PCP 的 不 同 之 处 在 于 : 匹 
配 需要 以 序列 中 的 第 一 个 骨牌 开始 。 如 果 将 P AE PCP 的 一 个 实例 ， 而 不 是 看 作 MPCP 
的 一 个 实例 ， 则 无 论 M 是 否 接 受 w， 显 然 它 都 有 一 个 匹配 。 你 能 发 现 它 吗 ? GRR: 它 非 
常 短 。) 

现在 说 明 怎 么 将 已 转化 为 PCP 的 实例 已 ， 使 之 仍然 模拟 M Ew 上 的 运行 。 这 时 用 了 
一 点 技术 上 的 窍门 。 思 路 是 : 以 “第 一 个 骨牌 开始 ”为 要 求 ， 并 且 将 这 个 要 求 直接 放 人 问 
题 ， 使 其 自动 成 为 强制 性 的 。 这 样 ， 就 不 需要 明确 地 提出 这 个 要 求 。 为 此 引入 一 些 记 号 。 

设 u= uuz: u, 是 一 个 长 度 为 n WP, EM ku, uk kuk EM FETS: 


来 完成 匹配 : 





Ku= Ul * uz * uz * 8 * Un 
uk= u * Uz * U3 * “° * Un * 
Kkuk= * uj * uz * U3 * =° * Uy * 


XE, ku 是 在 x 中 的 每 个 字母 前 增加 符号 x, uk EE u 中 的 每 个 字母 后 增加 符号 
k. kuk EE u 中 每 个 字母 的 前 和 后 都 增加 符号 * 。 为 将 P 转换 为 PCP 的 一 个 实例 P, 
做 下 面 的 事情 : WR P' 是 如 下 的 簇 : 

tk 
bal 


(Lis: Lee) Les) 
BLS 已 是 如 下 的 能 


laen [esse]: (esse > Ee) PST} 
EER K PAWE PCP ASCH, MEAT LAA SB, FT REA AVE A A E — BE — Ae E e 
Fux 
因为 它 是 顶部 和 底部 以 相同 符号 〈 即 * ) 开始 的 唯一 的 骨牌 。 除 了 强迫 以 第 一 个 骨牌 开始 


匹配 以 外 ，* 的 使 用 并 不 影响 可 能 的 匹配 ， 因 为 它们 被 原来 的 符号 相互 隔 开 ， 原 来 的 符号 
现在 出 现在 匹配 的 偶数 位 。 骨 牌 

















ka 
Q 
是 用 来 让 项 部 在 匹配 的 最 后 再 增加 一 个 * 。 s 


148 BRD THERBH 


5.3 了 映射 可 归 约 性 


前 面 已 经 说 明了 ， 使 用 可 归 约 性 技术 可 以 证 明 各 种 问题 的 不 可 判定 性 。 本 节 将 可 归 约 
性 这 个 概念 形式 化 ， 这 样 就 能 更 精确 地 使 用 它 ， 例 如 ， 证 明 某 些 语言 不 是 图 灵 可 识别 的 ， 
此 外 还 可 应 用 于 复杂 性 理论 中 。 

将 一 个 问题 归 约 为 另 一 个 问题 的 概念 可 以 用 多 种 方式 来 形式 定义 ， 选 择 使 用 哪 种 
方式 要 根据 具体 应 用 情况 。 我 们 的 选择 是 一 种 简单 方式 的 可 归 约 性 ， 叫 作 映射 可 归 约 
{© (mapping reducibility) 。 

粗略 地 说 ,“ 用 映射 可 归 约 性 将 问题 A 归 约 为 问题 刀 ” 指 的 是 ， 存 在 一 个 可 计算 函数 ， 
它 将 问题 A 的 实例 转换 成 问题 B 的 实例 。 如 果 有 了 这 样 一 个 转换 函数 〈 称 为 归 约 )， 就 能 用 
B 的 解决 方案 来 解 A。 原 因 是 ，A 的 任何 一 个 实例 可 以 这 样 来 解 : 首先 用 这 个 归 约 将 A 转换 
为 B 的 一 个 实例 ， 然 后 应 用 B 的 解决 方案 。 映 射 可 归 约 性 的 一 个 精确 定义 在 下 文中 介绍 。 


5.3.1 可 计算 函数 


图 灵机 计算 函数 的 方式 是 : 将 函数 的 输入 放 在 带子 上 ， 开 始 运 行 ， 并 以 停机 后 的 带子 
作为 函数 的 输出 。 

函数 f:5* 一 53* 是 一 个 可 计算 函数 (computable function) ， 如 果 有 某 个 
图 灵机 M， 使 得 在 每 个 输入 w 上 M 停机 ， 且 此 时 只 有 w) 出 现在 带子 上 。 

ES 国 ”整数 上 所 有 通常 的 算术 运算 都 是 可 计算 函数 。 例 如 ， 可 以 制造 一 个 机 器 ， 它 
以 《m，n〉 为 输入 上 且 返回 mm 与 nn 的 和 m 十 nxn。 在 这 里 不 给 出 细节 ， 而 把 它们 当 作 练习 。 s 

GED 可 计算 函数 可 以 是 机 器 的 描述 之 间 的 变换 。 例 如 ， 如 果 w=(M)》 是 图 灵机 
M 的 编码 ， 则 可 以 有 一 个 可 计算 函数 f， 以 ww 为 输入 ， 且 返回 一 个 图 灵机 的 描述 CM’. 
M' 是 一 个 与 M 识别 相同 语言 的 机 器 ， 但 M' 从 不 试图 将 它 的 读 写 头 移 出 它 的 带子 的 左 端 
Ai. RM f 通过 在 M 的 描述 中 加 入 一 些 状态 来 完成 这 个 任务 。 如 果 ww 不 是 图 灵机 的 合法 
编码 ， 厂 就 返回 s。 = 


5.3.2 了 映射 可 归 约 性 的 形式 化 定义 

现在 定义 映射 可 归 约 性 。 同 以 往 一 样 ， 以 语言 来 表示 计算 问题 。 

STD 语言 A 是 映射 可 归 约 到 语言 也 的 ， 如 果 存 在 可 计算 函数 f/;5* > 使 
得 对 每 个 w, 

wEA S f(w)EB 

记 做 A B。 称 函数 f 为 从 A 到 B 的 归 约 。 

图 5-6 说 明了 映射 可 归 约 性 。 

A 到 B 的 映射 归 约 提供 了 将 A 的 成 员 测试 问题 转化 为 
B 的 成 员 测 试问 题 的 方法 。 为 了 检查 是 否 有 wEA， 可 使 
用 这 个 归 约 三 将 芭 上 映射 到 f(w)， 然 后 检查 是 否 f(w) EB。 
术语 映射 归 约 来 自 于 提供 归 约 手段 的 函数 或 映射 。 图 5-6 将 A 归 约 到 B 的 函数 了 





昌 “有些 教科 书 称 之 为 多 一 可 归 约 性 (many-one reducibility) 。 
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如 果 一 个 问题 映射 可 归 约 到 第 二 个 问题 ， 且 第 二 个 问题 先前 已 被 解决 ， 那 就 能 得 到 原 
来 问题 的 解 。 定 理 5. 16 说 明 这 个 思路 。 
如 果 A 二 B 且 B 是 可 判定 的 ， 则 A 也 是 可 判定 的 。 
证 明 设 M 是 B 的 判定 器 ,，f 是 从 A 到 B 的 归 约 。A 的 判定 器 NN 的 描述 如 下 : 
N= 二 “对 于 输入 w: 
1. 计算 f(w)。 
2. Æ fw) 上 运行 M， 输 出 M 的 输出 。” 
显然 ， 如 果 wEA， 则 fwEB, AA fEMA 到 B 的 归 约 。 因 此 ， 只 要 wE€EA， 则 
M 接受 f(w)。 故 NN 的 运行 正如 所 求 。 i 
定理 5.16 的 下 列 推 论 是 证 明 不 可 判定 性 的 主要 工具 。 
如 果 AK, BHA 是 不 可 判定 的 ， 则 召 也 是 不 可 判定 的 。 
前 面 的 一 些 证 明 使 用 了 可 归 约 性 方法 。 回 顾 这 些 证 明 就 可 得 到 映射 可 归 约 性 的 一 些 
例子 。 
2 小 ”定理 5.1 使 用 从 Arm 出 发 的 一 个 归 约 ,证 明了 HALT MEAD AER. 
这 个 归 约 说 明了 如 何 用 HAL Tom 的 判定 器 给 出 Arm 的 判定 器 。 以 下 展示 从 Arm 到 
HALTrM 的 映射 可 归 约 性 ， 为 此 必须 提供 一 个 可 计算 函数 f， 它 使 用 形 如 〈“M,w〉 的 输 
和 入， 返回 形 如 〈M ,w’〉 的 输出 ， 使 得 
(M, w) E€ Arm %4 EN 4M w) E HALT 
下 面 的 机 器 下 计算 了 归 约 了: 
F=“ 对 于 输入 (M, w): 
1. 构造 下 列 图 灵机 M 。 
M 一“ 对 于 输入 x: 
a. Æ x EZT M. 
b. 如 果 M He, WHE. 
c. WR M 拒绝 ， 则 进入 循环 。? 
2. 输出 <M’,w).” 
对 于 形式 不 正确 的 输入 串 在 此 还 有 一 些小 问题 ， 就 是 如 果 图 灵机 下 确定 某 输入 对 于 输 
和 人 入行 的 描述 “对 于 输入 〈M,wmw) :” 来 说 形式 不 正确 ， 因 而 此 输入 不 在 Amt, WAXD 
图 灵机 输出 的 串 也 不 在 HALTrm 中 。 可 是 所 有 不 在 互 ALTTrx 中 的 串 都 将 被 处 理 。 应 当 指 
出 ， 通 常 而 言 ， 当 我 们 描述 一 个 图 灵机 进行 A 到 B 的 归 约 时 ， 都 假定 形式 不 正确 的 输入 
串 已 经 被 映射 到 B 之 外 了 。 x 
CUED 定理 5.11 中 的 波斯 特 对 应 问题 是 不 可 判定 的 ， 其 证 明 中 包含 了 两 个 映射 
归 约 。 它 首先 证 明了 Arm<n MPCP， 然 后 又 证 明了 MPCP<,, PCP。 对 这 两 种 情形 ， 都 
能 容易 地 得 到 实际 的 归 约 函数 ， 且 能 容易 地 证 明 它 们 是 映射 归 约 。 如 练习 5.6 所 示 ， 映 射 


可 归 约 性 是 传递 的 ， 故 这 两 个 归 约 合 起 来 蕴涵 Arw<, PCP, z 
在 定理 5. 4 的 证 明 中 ， 隐 含 了 一 个 从 Erm 到 EQrw 的 映射 归 约 。 此 归 约 f 
HAA (M) 映射 到 输出 (MM), Ah Mi 是 拒绝 所 有 输入 的 机 器 。 此 


CERA) 本 节 定 义 了 映射 可 归 约 性 的 形式 概念 ， 本 章 的 前 面部 分 所 使 用 的 可 归 约 性 
都 是 非 形式 概念 。 定 理 5. 2 证明 Erm 是 不 可 判定 的 ， 这 个 证 明说 明了 映射 可 归 约 性 的 形式 
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概念 与 可 归 约 性 的 非 形式 概念 之 间 的 差别 。Erw 的 不 可 判定 性 是 通过 将 Arw 归 约 到 它 来 证 
明 的 。 现 在 来 看 看 能 否 将 这 个 归 约 转换 为 映射 归 约 。 

根据 原来 的 归 约 可 以 很 容易 地 构造 函数 S EA M, w) WWA, FERE M), 
其 中 Mi 就 是 在 那个 证 明 中 描述 的 图 灵机 。 但 M 接受 w 当 且 仅 当 LM1) RZ, W f 是 从 
AtM 到 Erm 的 映射 归 约 。 它 还 证 明了 Erm 是 不 可 判定 的 ， 因 为 可 判定 性 不 受 求 补 的 影响 。 
但 它 没有 给 出 从 Ar 到 Erw 的 映射 归 约 。 事 实 上 ， 没 有 这 样 的 归 约 存在 。 练 习 5. 5 要 求证 
明 这 个 结论 。 a 

映射 可 归 约 性 对 求 补 运算 是 敏感 的 ， 这 对 用 可 归 约 性 来 证 明 某 些 语言 的 不 可 识别 性 
非常 重要 。 也 可 以 使 用 映射 可 归 约 性 来 证 明 某 些 问题 不 是 图 灵 可 识别 的 。 下 列 定理 与 定 
理 5. 16 十 分 相似 。 

如 果 A 二 mB， 且 B 是 图 灵 可 识别 的 ， 则 A 也 是 图 灵 可 识别 的 。 

此 定理 的 证 明 与 定理 5. 16 的 证 明 类 似 ， 只 是 将 M 和 N 改 为 识别 器 而 非 判 定 器 。 

如 果 ALn B， 且 A 不 是 图 灵 可 识别 的 ， 则 B 也 不 是 图 灵 可 识别 的 。 

作为 这 个 推论 的 一 个 典型 应 用 , BEA 是 Arw 的 补 集 Arw 。 由 推论 4.17 知 ，Arw 不 是 
图 灵 可 识别 的 。 由 映射 可 归 约 性 的 定义 不 难看 出 : ALm B 与 A 三 mB 有 相同 的 含义 : 为 证 
明 B 不 是 可 识别 的 ， 可 以 证 明 Armm B。 还 可 以 使 用 映射 可 归 约 性 来 证 明 某 些 问 题 既 不 
是 图 灵 可 识别 的 ， 也 不 是 补 图 灵 可 识别 的 ， 就 像 下 面 的 定理 那样 。 

EQrtMm 既 不 是 图 吴 可 识别 的 ， 也 不 是 补 图 灵 可 识别 的 。 

证 明 首先 证 明 EQrw 不 是 图 灵 可 识别 的 。 为 此 ， 只 要 证 明 Atrm 可 归 约 到 EQrm 即 可 。 
归 约 函数 f 如 下 : 

F 一 “对 于 输入 〈M,zw) ， 其 中 M 是 图 灵机 ，w 是 串 : 

1. 构造 下 列 两 个 机 器 Mi 和 M2 。 
Mi = “对 于 任何 输入 : 
a. 422%,’ 
M: 二 “对 于 任何 输入 : 
a. 在 ww 上 运行 M， 如 果 它 接受 ， 就 接受 。? 
2. 输出 (Mi，M;)。” 

XE, M 什么 也 不 接受 。 如 果 M 接受 ww， 则 Ms 接受 每 一 个 输入 ， 故 两 个 机 器 不 等 
价 。 相 反 ， 如 果 M 不 接受 w， 则 M: 什么 也 不 接受 ， 故 它们 是 等 价 的 。 这 样 了 将 Arw 归 
约 到 EQrmw， 这 正 是 我 们 所 希望 的 。 

为 了 证 明 EQrw 不 是 图 灵 可 识别 的 ， 只 要 给 出 一 个 从 Ar 到 EQrm 的 补 ( 即 EQrm) 
的 归 约 。 因 此 要 证 明 Arm<m EQrmw。 下 面 的 图 灵机 G 计算 归 约 函数 g 。 

G= 二 “对 于 输入 〈M,w)， 其 中 M 是 图 灵机 ，z 是 串 : 

1. 构造 下 列 两 个 机 器 ，Mi 和 Mo。 
Mi = 二 “对 于 任何 输入 : 
a. HEE.’ 
M: 二 “对 于 任何 输入 : 
a. 在 w 上 运行 M， 
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b. 如 果 它 接受 ， 就 接受 。? 
2. Siti (Mi, M2).” 


fg 之 间 的 唯一 差别 在 机 器 Mi E. ES, Slat Mi 总 是 拒绝 ， 而 在 g 中 ， 它 总 


是 接受 。 在 f 和 g 中 ，M 接受 w 当 且 仅 当 Ms RZA., Æg FP, MÉZ w SHANK 
M, 和 M: 等 价 。 这 就 是 g 是 从 Artv 到 EQrtM 的 归 约 的 原因 。 = 


练习 


5. 1 
5.2 
5.3 


问题 


5.9 


Un 


. 10 
sdl 


. 12 


n un 


sa 


13 
.14 


un 


证 明 有 EQcrc 是 不 可 判定 的 。 
证 明 EQcrG 是 补 图 灵 可 识别 的 。 
请 找 出 下 面 波 斯 特 对 应 问题 (PCP) 实例 中 的 一 个 匹配 : 
I 
如 果 A 二 m B 目 B 是 一 个 正则 语言 ， 这 是 否 蕴 涵 着 A 也 是 一 个 正则 语言 ? ATA? 
证 明 Arw 无 法 映射 归 约 到 Er 。 换 句 话 说， 也 就 是 证 明 没 有 可 计算 函数 可 以 将 Arw 归 约 为 Em. 
(提示 : H ArmA Erm 的 一 些 已 知 的 矛盾 和 事实 来 证 明 ,) 
WHS 是 一 个 传递 关系 。 
证 明 : 如 果 A 是 图 灵 可 识别 的 ， 且 A 二 m A， 则 A 是 可 判定 的 。 
在 定理 5. 11 的 证 明 中 ， 修 改 了 图 灵机 M， 使 得 它 永 不 试图 将 其 读 写 头 移 出 带子 的 左 端点 。 假 设 
如 果 不 做 这 样 的 修改 ， 将 不 得 不 对 PCP 做 怎样 的 修改 来 处 理 这 种 情形 ? 


设 4AMBTIGcre=((G)1G 是 歧义 的 CFG}. WEH AMBTICcrc 是 不 可 判定 的 。《〈 提 示 : 使 用 来 目 PCP 
的 归 约 。 给 定 一 个 PCP 的 实例 


用 下 列 规则 构造 一 个 CFG G: 


S>T|B 

Tt; Tay | +++ | te Tax | tra |= | tae 

Bb; Bay | +++ | beBax | bia) | +++ | bear 
其 中 al1 ，…，ak 是 新 的 终结 符号 。 证 明 这 个 归 约 可 行 。) 


证 明 当 上 且 仅 当 A<n Arwx 时 ，A 是 图 灵 可 识别 的 。 

证 明 当 且 仅 当 A 二 ms。0*x1x 时 ，A 是 可 判定 的 。 

设 J=(w | 对 于 某 个 -EArw 有 w=0r, MFHT yE Arw 有 w=1y). 证明 J 和 J 都 不 是 图 灵 可 识别 
的 。 
给 出 一 个 不 可 判定 语言 B 的 例子 ， 使 得 Bn B. 

定义 二 头 有 穷 自 动机 (two-headed finite automaton, 2DFA) 为 确定 型 有 穷 自 动机 ， 它 有 两 个 双向 
只 读 头 ， 只 读 头 部 从 输入 带 的 左 端点 开始 ， 可 以 独立 地 向 左 或 向 右 移动 。2DFA 的 带子 是 有 限 的 ， 
正好 包含 输入 和 两 个 额外 空白 带子 方 格 。 这 两 个 空白 带子 方 格 一 个 在 左 端 点 ， 一 个 在 右 端 点 ， 它 
们 被 用 作 定 界 符 。2DFA 通过 进入 一 个 特殊 的 接受 状态 来 接受 它 的 输入 。 例 如 ，2DFA 可 以 识别 
语言 {a"b"c” | ?之 0} 。 

a. 设 AzpFA 王 {(M,z)|M 是 个 2DFA 且 接受 z}。 证 明 AzpFA 是 可 判定 的 。 

b. 设 Esppa={(M )|M 是 个 2DFA H L(M) =}. 证明 Ezpra 不 是 可 判定 的 。 

一 个 二 维 有 穷 自 动机 (two-dimensional finite automaton, 2DIM-DFA) 的 定义 如 下 : 输入 是 个 
mXn 和 矩形 (对 任意 m，n 宇 2)。 沿 着 和 矩形 边界 的 方 格 包含 符号 #， 而 内 部 方 格 包 含 输入 字母 表 中 
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nn mM 


a5. 


11 
.18 


.19 


20 


.21 


.22 


.23 


.24 


A Zo 
AS, 


26 


27 
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的 符号 。 转 移 函 数 6:QX (5U{#)) 一 QX {L,R,U,D} 用 来 指示 下 一 个 状态 和 读 写 头 的 新 位 置 
( 左 ， 右 ， 上 ， 下 )。 当 它 进入 事先 设 定 的 接受 状态 中 的 某 一 个 时 ， 机 器 就 接受 。 如 果 它 试图 移 
出 输入 矩形 或 永 不 停机 ， 它 就 拒绝 。 如 果 两 个 这 样 的 机 器 接受 相同 的 和 矩形， 那么 它们 是 等 价 
的 。 考 虑 检查 两 个 这 样 的 机 器 是 否 等 价 的 问题 。 将 这 个 问题 表达 成 语言 ， 并 证 明 它 是 不 可 判定 的 。 
赖 斯 定理 设 己 是 任何 图 灵机 的 语言 的 非 平 凡 属 性 。 证 明确 定 某 一 图 灵机 的 语言 是 否 具有 属性 
P 这 一 问题 是 不 可 判定 的 。 更 正式 地 说 ， 设 已 是 一 个 语言 ， 它 由 图 灵机 的 描述 组 成 ， 且 Pi 
足下 列 两 个 条 件 : 首先 ，P 是 非 平凡 的 一 一 它 包含 某 些 图 灵机 的 描述 ,但 不 是 所 有 的 ; HK, 
P 是 图 灵机 的 语言 的 属性 一 一 无 论 何 时 工 C(MI )= 工 (M2z: ) ， 当 上 且 仅 当 (Ms)EP 时 ,， A (MDE 
P， 此 处 的 Mi 和 Ms: 是 任意 图 灵机 。 证 明 P 是 一 个 不 可 判定 语言 。 
证 明 在 问题 5. 16 中 的 两 个 条 件 对 于 证 明 P 的 不 可 判定 性 是 不 可 缺少 的 。 
使 用 问题 5. 16 中 的 赖 斯 定理 ， 证 明 下 列 语言 是 不 可 判定 的 : 
Aa. INFINITEm=({(M)|M 是 一 个 图 灵机 ， 且 LOM 是 一 个 无 限 语言 }。 
b. {《M) |M 是 一 个 图 灵机 , 且 1011EL(M)}. 
c. ALLTM 王 {(M) |M 是 一 个 图 灵机 , 且 工 CM) 王 了 ) 。 
对 于 任意 自然 数 zx， 设 

Sr++ 去 为 硼 数 

/2 并 为 偶数 
如 果 从 整数 工 开 始 ， 对 f 进行 迭代 ， 将 可 以 获得 如 下 序列 : z, fa), FC), e, MER 1 
便 停止 。 例 如 ， 如 果 r=17, WAL BBS 17, 52, 26, 13, 40, 20, 10, 5, 16, 8, 4, 
2，1。 大 量 的 计算 机 测试 显示 ， 在 1 到 一 个 正 整数 的 区 间 内 任 选 一 点 作为 起 始点 ， 都 可 以 得 到 
一 个 以 1 为 结尾 的 序列 。 但 是 ， 是 否 以 任意 的 正 整 数 为 起 始点 所 得 到 的 序列 都 能 以 1 为 结尾 还 
尚未 得 证 ， 此 问题 被 称 为 3z 十 1 问题 。 
假设 图 灵机 HAF Am, A 互 来 描述 另 一 个 图 灵机 ， 该 图 灵机 能 够 满足 3z 十 1 问题 。 
证 明 下 列 两 种 语言 是 不 可 判定 的 : 
a. OVERLAPcrc = {(G,H)|G MH CFG, ALIGDNL(W¢D). Gr: 与 问题 5. 9 的 

提示 相同 。) 

b. PREFIX-FREEcrc = {(G) |G 是 一 个 CFG, H L(G) 是 前 缀 无 关 的 ) 。 
考虑 这 样 的 问题 : 确定 PDA 是 否 接受 某 些 形式 为 {zw|wE{0,1)* ) 的 串 ， 用 计算 历史 的 方 
法 证 明 该 问题 是 不 可 判定 的 。 
设 X= 二 {4M,w)|M 是 一 个 单 带 图 灵机 , 且 M 从 不 修改 带子 上 包含 输入 w 的 那 一 部 分 }。 请 问 X 
是 可 判定 的 吗 ? 证 明 你 的 结论 。 
对 CFG G 中 的 变 元 A ， 如 果 A 出 现在 某 字符 串 wEG 的 所 有 派生 中 ， 则 称 A 是 必要 的 (neces- 
sary)。 设 NECESSARYcrc = {(G,A)|A ÆG 的 一 个 必要 变 元 }。 
a. 证 明 NECESSARYcrG 是 图 灵 可 识别 的 。 
b. 证 明 NECESSARYcrc 是 不 可 判定 的 。 
对 一 个 CFG， 如 果 移 除 其 任何 一 个 规则 都 会 改变 其 产生 的 语言 ， 则 称 该 CFG 是 最 小 的 。 设 
MINcrc = { (G) |G 是 一 个 最 小 的 CFG ) 。 
a. WEAR MINcrc 是 图 灵 可 识别 的 。 
b. 证 明 MINcrcG 是 不 可 判定 的 。 
设 T={ (M |M 是 一 个 图 灵机 ,每 当 M 接受 w 时 ,IM 也 接受 wR*}, 证 明代 是 不 可 判定 的 。 
考虑 这 样 的 问题 : 一 个 双 带 图 灵机 ， 当 它 在 输入 w 上 运行 时 ， 检 查 它 是 否 在 第 二 条 带子 上 写 下 
一 个 非 空白 符 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
考虑 这 样 的 问题 : 一 个 双 带 图 灵机 ， 检 查 在 计算 任意 输入 串 的 过 程 中 它 是 否 在 第 二 条 带子 上 写 
下 一 个 非 空白 符 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
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考虑 这 样 的 问题 : 一 个 单 带 图 灵机 ， 检 查 在 计算 任意 输入 串 的 过 程 中 它 是 否 在 非 空白 符 上 写 下 一 
个 空白 符 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 

图 灵机 的 一 个 无 用 状态 〈useless state) 是 对 任何 输入 它 都 不 会 进入 的 状态 。 考 虑 检查 一 个 图 灵机 
是 否 有 无 用 状态 的 问题 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
考虑 这 样 的 问题 检查 图 灵机 在 输入 w 上 当 其 读 写 头 处 于 带子 最 左 方 格 时 ， 是 否 曾 经 试图 将 读 写 
头 回 左 移 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 

考虑 这 样 的 问题 : 检查 图 灵机 在 输入 记 上 是 否 曾经 在 计算 过 程 的 某 个 地 方 试图 将 读 写 头 向 左 移 。 
将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

设 FT 一 人 0,1,U) 是 此 问题 中 所 有 图 灵机 的 带子 字母 表 。 下 面 是 勤劳 函数 (busy beaver function) 
BB:N>N 的 定义 : 对 于 & 的 每 个 取 值 ， 考 虑 所 有 有 个 状态 的 图 灵机 ， 当 以 空白 带 为 开始 时 该 
图 灵机 停机 。 设 BBG) 是 这 些 图 灵机 的 带子 上 所 留 下 的 1 的 最 大 个 数 ， 证明 BB 是 不 可 计算 
PRI 2 

证 明 波 斯 特 对 应 问题 P CP) 在 一 元 字母 表 上 MAF HRI={(1} b) 是 可 判定 的 。 

证 明 波 斯 特 对 应 问题 P CP) 在 二 元 字母 表 上 (〈 即 在 字母 表 3 一 {0,1》 上 ) 是 不 可 判定 的 。 

对 于 简易 波斯 特 对 应 问题 (silly Post Correspondence Problem，SPCP) ， 在 每 个 对 中 ， 顶 部 的 串 与 
其 底部 的 串 长 度 相 同 ， 证 明 SPCP 是 可 判定 的 。 

证 明 存 在 (1)* 的 子 集 是 不 可 判定 的 。 
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5. 16 


为 了 得 到 矛盾 ， 我 们 假定 通过 归 约 fA Arm Sm Erv。 根 据 映 射 可 归 约 的 定义 ， 用 同样 的 归 约 函 
数 了 可 得 出 A 二 m Erw， 然 而 Erm 是 图 灵 可 识别 的 (参见 练习 4.5 的 解答 )，Arw 却 不 是 图 灵 可 
识别 的 ， 这 与 定理 5. 22 矛盾 。 
假定 AX, B, Bin C ， 那 么 有 可 计算 函数 f Mg 使 得 TEA 对 f(z)EB,y€ B 舍 g(y)EC。 考 虑 
复合 函数 h(x) 二 g(f(x))， 构 造 一 个 图 灵机 按 以 下 方式 计算 h: 首先 ， 用 一 个 图 灵机 模拟 f， 输 入 
为 输出 为 y (由 于 已 经 假设 f 是 可 计算 的 ， 所 以 这 样 的 图 灵机 是 存在 的 ); 然后 ， 用 一 个 图 灵 
机 模拟 g, WAX y, WHA ha) Sga), Ai h EHARA, H zxEAGACz)EC。 故 此 ， 
通过 归 约 函数 hh 有 A<n C. 
BEAS A ， 那 么 通过 同样 的 映射 归 约 有 A 二 mA。 因为 A 是 图 灵 可 识别 的 ， 所 以 根据 定理 5. 22 
可 推出 A 也 是 图 灵 可 识别 的 ， 再 由 定理 4. 16 可 以 推出 A 是 可 判定 的 。 
需要 处 理 这 样 的 情况 : 读 写 头 已 经 到 达 带 子 的 最 左 端 格 子 上 ， 但 仍然 试图 向 左 移 动 。 为 此 对 于 每 
个 q，r€EQ 和 a，6bET， 可 增加 如 下 的 骨牌 : 

Ezd 

# rb 

此 处 Cq a) = (rb, L). WKH, GFESLEB-FRAMEBA, WHA-TP+AARRA 





Pore 
H H go w Ww2 Wn 
用 反 证 法 ， 设 P 是 满足 属性 的 可 判定 语言 ， 并 设 Rp 就 是 一 个 判定 P 的 图 灵机 。 现 在 证 明 如 何 通 
过 构造 图 灵机 S, HM Rp 来 判定 ATtw。 首 先 设 Tg 是 一 个 总 是 拒绝 的 图 灵机 ， 即 L(Tg )= 二 名 。 不 失 
一 般 性 ， 可 以 假定 〈Tez EP, ANG (Te )EP， 那么 就 可 以 用 P 替代 PP KHT. hF PE 
非 平凡 的 ， 所 以 存在 一 个 图 灵机 工 使 得 (TEP. FERAM Re 能 够 区 别 Tg 和 工 的 能 力 设 计 一 
个 可 以 判定 Arw 的 图 灵机 S: 
S=“xXt TA (M,w): 

l AMA w 构造 下 面 的 图 灵机 M.。 

M 二 “对 于 输入 cz: 
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a. 在 w 上 模拟 M， 如 果 停 机 和 拒绝 ， 那 么 拒绝 。 
如 果 接 受 ， 则 进入 第 2 阶段 。 
b. 在 z 上 模拟 工 ， 如 果 接 受 ， 那 么 接受 。? 
2. 用 图 灵机 Rp 确定 是 否 有 《Ms)EP。 如 果 返 回 是， 那么 接受 ; 如 果 返 回 否 ， 那 么 拒绝 。” 
如 果 MES w, PARRA Mu 可 以 模拟 工 。 如 果 MÉZ w ARD, 那么 L(M,) 等 于 
L(T)。 因 此 ， 当 且 仅 当 M 接受 ww 时 (Ma) EP. 
5.18 a INFINITETM 是 一 个 关于 图 灵机 描述 的 语言 ， 它 满足 赖 斯 定理 的 两 个 条 件 ， 首先 ， 由 于 某 些 图 
灵机 有 无 限 的 语言 ， 但 另 一 些 却 没有 ， 所 以 它 是 非 平 凡 的 ; 其 次 ， 它 仅仅 依赖 于 语言 。 所 以 如 
果 两 个 图 灵机 识别 同一 个 语言 ， 那 么 这 两 个 图 灵机 要 么 都 有 ,或 要 么 都 没有 相应 的 描述 在 
INFINITErM 之 中 。 因 此 ， 由 赖 斯 定理 可 以 推出 TNFINITErw 是 不 可 判定 的 。 
5.26 设 B= 二 {(M,w)|M 是 一 个 双 带 图 灵机 ， 当 M 运行 在 w LN, 它 在 其 第 二 个 带子 上 写 一 个 非 空白 
符 }。 证 明 Arm THAR) B。 为 了 得 到 矛盾 ， 设 图 灵机 R 可 判定 B。 构 造 图 灵机 S, €H 尺 来 判定 
ATM o 
S="Xt FRA (M, w): 
1. 用 M 构造 下 面 的 双 带 图 灵机 工 。 
T= 二 “对 于 输入 z: 
a. 在 x 上 用 第 一 个 带子 模拟 M.。 
b. 如 果 模 拟 表明 M 接受 ， 则 在 第 二 个 带子 上 写 一 个 非 空 白 符 。? 
2. Æ (T,w) 上 运行 R， 确 定 在 输入 w 上 是 否 在 第 二 个 带子 上 写 了 一 个 非 空 白 符 。 
3. WR R 接受 ， 则 M 接受 w， 因 此 接受 ， 否则 拒绝 。” 
5.27 设 C={(M)|M 是 双 带 图 灵机 , 当 它 运行 在 某 些 输 入 上 时 , 它 在 其 第 二 个 带子 上 写 一 个 非 空 白 符 }。 
证 明 Atm 可 归 约 到 C。 为 了 得 到 了 矛盾， 设 图 灵机 R 可 判定 C。 构 造 图 灵机 S$， 它 用 尺 来 判定 Arw 。 
S 二 “对 于 输入 (M,w): 
1. H MA w 构造 下 面 的 双 带 图 灵机 Tw. 
Tw 二 “对 于 任何 输入 : 
a. 在 w 上 用 第 一 个 带子 模拟 MM 。 
b. 如 果 模 拟 表明 M 接受 ， 则 在 第 二 个 带子 上 写 一 个 非 空 白 符 。? 
2. Æ (Ty) EZI R, ME Tw 是 否 在 第 二 个 带子 上 写 了 一 个 非 空白 符 。 
3. WR R 接受 ， 则 M 接受 w， 因 此 接受 ; 否则 拒绝 。” 
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可 计算 性 理论 的 高 级 专题 





本 章 更 深入 地 研究 可 计算 性 理论 中 的 下 列 四 个 专题 : (1) 递归 定理 ; (2) 逻辑 理论 ; 
(3) 图 灵 可 归 约 性 ; (4) 描述 复杂 性 。 除 了 在 逻辑 理论 一 节 的 结尾 应 用 了 递归 定理 外 ， 本 
章 各 节 基 本 上 相互 独立 。 本 书 中 第 三 部 分 也 不 依赖 于 本 章 的 内 容 。 


6.1 递归 定理 


递归 定理 (recursion theorem) 是 一 个 数学 结论 ， 在 可 计算 性 理论 的 高 级 研究 中 起 着 
重要 的 作用 。 它 与 数理 逻辑 、 自 再 生 系 统 理论 以 及 计算 机 病毒 都 有 联系 。 

为 介绍 递归 定理 ， 考 察 与 生命 科学 相关 的 一 个 悖 论 ， 此 悖 论 是 关于 制造 这 样 一 个 机 
器 ， 它 要 构造 它 自己 的 复制 品 。 这 个 悖 论 可 以 概述 如 下 : 

1. 生物 都 是 机 器 。 

2. 生物 都 能 自 再 生 。 

3. 机 器 不 能 自 再 生 。 

第 一 句 话 是 现代 生物 学 的 一 个 宗旨 ， 人 们 认为 生物 体 是 以 机 械 方 式 运作 的 。 第 二 句 话 
明显 成 立 ， 自 再 生 能 力 是 每 个 生物 物种 的 本 质 特征 。 对 第 三 句 话 作 如 下 讨论 。 考 虑 构造 其 
他 机 器 的 一 个 机 器 ， 比 如 生产 小 汽车 的 自动 生产 线 。 原 材料 从 一 端 进入 ， 加 工 机 器 人 根据 
指令 运行 ， 完 整 的 汽车 从 另 一 端 出 来 。 

可 以 断言 ， 在 如 下 意义 下 ， 生 产 线 肯定 要 比 它 制造 的 汽车 复杂 : 设计 生产 线 要 比 设计 
汽车 更 困难 。 这 个 结论 必然 是 真 的 ， 因 为 生产 线 的 设计 中 除了 含有 加 工 机 器 人 的 设计 之 
外 ， 还 含有 汽车 的 设计 。 同 样 的 原因 适用 于 构造 机 器 B 的 机 器 A : A 肯定 要 比 B 复杂 。 但 
一 个 机 器 不 会 比 它 自己 更 复杂 。 因 此 没有 机 器 能 够 制造 它 自己 ， 故 自 再 生 是 不 可 能 的 。 

怎么 才能 解决 这 个 悖 论 呢 ? 答案 很 简单 : 第 三 句 是 不 正确 的 。 制 造 能 生产 自己 的 机 器 
是 可 能 的 ， 递 归 定 理 就 是 说 明 怎 么 做 到 这 一 点 。 


6.1.1 自 引 用 


本 节 从 制造 一 个 图 灵机 开始 ， 此 图 灵机 忽略 输入 ， 且 打印 出 它 自 己 的 描述 。 我 们 称 这 
BLA SELF。 为 描述 SELF， 需 要 下 面 的 引 理 。 
存在 可 计算 函数 g:5* 一 5* ， 对 任意 串 w, qw) 是 图 灵机 Pu 的 描述 ， 
Pu AÉ E w, REAP. 
证 明 一旦 懂得 这 个 引 理 的 叙述 ， 证 明 就 容易 了 。 显 然 ， 可 以 任 取 一 个 字符 串 w, A 
后 从 它 构造 一 个 图 灵机 ， 使 得 此 图 灵机 将 也 内装 在 一 个 表 中 。 这 样 ， 当 此 图 灵机 开始 运行 
后 ， 它 只 要 简单 输出 w 即 可 。 下 列 图 灵机 Q 计算 q(w): 
Q= “Xt FRA w: 
1. 构造 下 列 图 灵机 Pa: 
Pu 一 “对 于 任意 和 输入: 
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a. WEMA. 
b. 在 带 上 写 下 w. 
c， 停 届 。” 
2 Wah Puta i 

图 灵机 SELF 有 两 个 部 分 ， 分别 叫 作 A 和 B。 将 A 和 B 想象 成 两 个 分 离 的 过 程 ， 它 
们 一 起 组 成 SELF。 我 们 希望 SELF 打印 出 《SELF)==(AB)，。 

A 部 分 首先 运行 ， 再 根据 完成 情况 将 控制 传 给 B. A 的 任务 是 打印 出 B 的 描述 。 反 过 
来 ，B 的 任务 是 打印 出 A 的 描述 ， 结 果 就 是 希望 的 SELF 的 描述 。 这 两 个 任务 相似 ,但 
它们 的 实现 却 不 同 。 先 来 说 明 怎 么 构造 A 部 分 。 

使 用 机 器 Pos) 来 定义 A， 其 中 Po MAX g Æ (B) ABA (A g((B)) 描述 ， 这 样 ，A 
部 分 是 一 个 打印 出 〈B》 的 图 灵机 。A 的 描述 依赖 于 是 否 已 经 有 了 的 描述 ， 所 以 在 构造 
BZA, TETRA 的 描述 。 

对 于 B 部 分 ， 你 也 许 十 分 想 用 aCA) 来 定义 ,但 这 不 可 行 。 这 样 做 将 是 用 A RE 
义 B， 而 定义 A 又 要 根据 B。 此 即 所 谓 循 环 定义 (circular definition), #i Ae BEW 
的 。 用 另 一 种 方法 来 定义 B， 使 之 能 打印 A: BMA 产生 的 输出 来 计算 A。 

定义 “A〉 是 gq((B))。 FRE RE MB: WR B 能 得 到 〈“B〉， 它 就 能 应 用 q 来 得 到 
(A)。 但 B 怎 么 做 才能 得 到 〈B〉 呢 ?” 当 A 结束 时 ， 它 被 留 在 带子 上 。 所 以 B 只 要 看 着 带 
子 就 能 得 到 〈B) 。 在 计算 gq(《(B))= 二 (A〉 之 后 ，B 将 之 加 到 带子 的 前 面 ， 然 后 将 A 和 B 组 
合成 一 个 机 器 并 在 带子 上 写 下 它 的 描述 (AB)=(SELF), KZ, 

内 一 了 ay H 

B 一 “对 于 输入 (M), HAM 是 一 个 图 灵机 的 一 部 分 : 

1. 计算 ga(M))。 
2. 将 其 结果 与 (M) 结合 来 组 成 一 个 完整 的 图 灵机 描述 。 
3. 打印 这 个 描述 ， 然 后 停机 。” 

至 此 SAI SELF 的 构造 。 图 全 1 SELF 
的 示意 图 。 

如 果 现在 运行 SELF， 能 观察 到 如 下 动作 ， SELF 的 控制 器 | | | | | | | 

1. 首先 人 运行， 它 在 带子 上 打印 (BY; 图 6-1 SELF 的 示意 图 ， 一 个 打印 

2. B 开始 运行 ， 它 查看 带子 ， 找 到 它 的 输入 (B); 它 目 己 的 描述 的 图 灵机 

3. Bit® g(《B))==(A)， 然 后 将 之 与 “B〉 合 并 ， 构 成 图 灵机 SELF 的 描述 (SELF); 

4. B 打印 这 个 描述 ， 且 停机 。 

容易 用 任何 程序 设计 语言 实现 这 个 构造 ， 即 得 到 一 个 程序 ， 输 出 就 是 它 自己 。 甚 至 用 
普通 的 英语 都 能 做 到 这 一 点 。 假 如 想 构造 一 个 英语 句子 ， 它 要 求 读者 打印 出 与 这 个 句子 相 
同 的 句子 。 一 个 方法 是 造 下 面 的 句子 : 

打印 这 个 语句 
这 个 语句 有 我 们 想 要 的 含义 ， 因 为 它 指示 读者 打印 出 这 个 语句 本 身 。 但 它 没 有 明确 地 翻译 
成 程序 设计 语言 ， 因 为 这 个 句子 中 的 自 引 用 词 “ 这 个 ”通常 没有 对 应 物 。 但 在 构造 这 样 的 
句子 时 ， 也 不 是 非 要 用 自 引 用 词 不 可 。 考 虑 下 面 的 变换 : 
打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 : 
“打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 :” 
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在 这 个 句子 中 ， 自 引用 词 被 一 个 同样 的 构造 所 取代 ， 这 样 的 构造 曾 被 用 来 制造 图 灵机 
SELF。 本 引 理 中 ，B 部 分 的 构造 是 如 下 的 句子 : 
打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 : 

A 部 分 与 之 相同 ， 只 是 用 引号 将 之 括 起 来 。A 提供 了 B 的 一 个 副本 给 B， 所 以 B 就 可 以 像 
图 灵机 一 样 来 处 理 那 个 副本 。 

递归 定理 提供 了 以 任意 程序 设计 语言 实现 自 引 用 词 “ 这 个 ”的 能 力 。 利 用 这 个 能 力 ， 
任何 程序 设计 语言 都 有 引用 它 自己 的 描述 的 能 力 。 下 面 将 看 到 它 的 一 些 应 用 ， 在 讨论 应 用 
之 前 ， 先 给 出 递归 定理 本 身 的 叙述 。 递 归 定 理 扩 展 了 在 构造 SELF 时 使 用 过 的 技术 ， 使 得 
一 个 程序 不 仅 能 得 到 它 自己 的 描述 ， 而 且 还 能 用 这 个 描述 继续 进行 计算 ， 而 不 是 仅仅 将 之 
打印 出 来 。 

GED nza) 设 工 是 计算 函数 1; 5* X I> 5* 的 一 个 图 灵机 。 则 存在 
计算 函数 +r:5* > 5* 的 一 个 图 灵机 尺 ， 使 得 对 每 一 个 w， 有 : 

r(w) =t((R) ,w) 

初 看 之 下 ， 此 定理 的 叙述 技术 性 很 强 ， 但 实际 上 ， 它 代表 的 事情 很 简单 。 为 了 制造 一 
个 能 得 到 自己 的 描述 ， 并 用 它 计 算 图 灵机 ， 只 需要 制造 一 个 在 上 述 定 理 中 称 为 工 的 图 灵 
机 ， 使 之 以 自己 的 描述 作为 输入 的 一 部 分 。 然 后 递归 和 定理 就 产生 一 个 新 的 机 器 下 ， 它 和 工 
一 样 运行 ， 只 是 R 的 描述 被 自动 地 装 在 工 中。 

证 明 此 证 明 与 SELF 的 构造 类 似 ， 分 三 部 
SAL, BAT RWGARIR, RPT Hee 
DRAHE., A6-2H RAHA. 

A 是 由 g((BT)) 描述 的 图 灵机 Pan. HT 人 Bip 
保持 输入 w， 我 们 重新 设计 g， 使 得 Pier 印 出 任何 预先 在 带子 上 存在 的 串 的 输出 。 在 A 
运行 之 后 ， 带 子 上 包含 w(BT) 。 

B 还 是 如 下 的 过 程 ， 检查 带子 ， 并 将 g 应 用 于 带子 内 容 ， 结 果 是 “A);。 然 后 BRA, 
BAT 组 合成 一 个 图 灵机 并 得 到 它 的 描述 (ABT)==(R);。 最 后 ， 描 述 的 编码 和 w 结合 ， 在 
带子 上 形成 结果 串 (Row), REHEAT. x 


6.1.2 递归 定理 的 术语 


递归 定理 指出 图 灵机 可 以 输出 自己 的 描述 ， 然 后 还 能 用 它 继续 进行 计算 。 初 一 看 ， 这 
个 能 力 只 是 对 一 些 无 意义 的 任务 有 用 ， 如 制造 一 个 打印 它 自己 的 备份 的 机 器 。 实 际 上 ， 下 
面 会 介绍 递归 定理 是 解决 某 些 与 算法 理论 有 关 的 问题 的 有 力 工 具 。 

在 设计 图 灵机 算法 时 ， 可 用 如 下 方式 使 用 递归 定理 。 如 果 你 正在 设计 一 个 图 灵机 M， 
则 可 以 在 M 的 算法 的 非 形式 描述 中 包含 如 下 短语 : “得 到 自己 的 描述 〈‘M)”。 一旦 得 到 自 
己 的 描述 ，M 就 能 像 使 用 其 他 已 计算 出 来 的 值 一 样 使 用 这 个 描述 。 例 如 ，M 可 以 简单 打 
印 出 《My ， 就 像 前 面 在 图 灵机 SELF 遇 到 的 一 样 ; 或 者 计算 M) 中 的 状态 数 ; 或 模拟 
《M)。 为 了 说 明 这 个 方法 ， 用 递归 定理 来 描述 机 器 SELF: 

SELF 一 “对 于 任意 输入 : 

1. 利用 递归 定理 得 到 它 自己 的 描述 (SELF). 
% 打印 <SELF),” | 
递归 定理 展示 了 怎样 实现 “获得 自己 的 描述 ”的 构造 。 为 了 产生 机 器 SELF, KAS 





158 BZR THEE 


FAAFIA T: 
了 一 “对 于 输入 (M, w): 
1. 打印 (M) 并 停机 。?” 
图 灵机 全 得 到 图 灵机 M 和 它 输入 的 串 w 的 描述 ， 它 打印 了 M 的 描述 (M). Sjak 
归 定 理 展示 怎样 获得 在 输入 w 上 的 图 灵机 R, 像 工 在 输入 〈‘R,w〉 上 那样 操作 。 因 此 R 
打印 出 RR 的 描述 ， 恰 好 是 机 器 SELF 所 需要 得 到 的 。 


6.1.3 应 用 


计算 机 病毒 (computer virus) 是 一 个 计算 机 程序 ， 它 被 设计 成 在 计算 机 中 传播 它 自 
己 。 顾 名 思 义 ， 它 与 生物 病毒 有 许多 共同 的 地 方 。 计 算 机 病毒 作为 一 段 代 码 而 单独 存在 
时 ， 是 不 活动 的 ， 但 是 ， 当 把 它 适 当地 放 和 人 宿主 计算 机 从 而 “感染 ” 它 时 ， 它 就 变 得 很 活 
跃 ， 传 染 它 自己 的 副本 给 其 他 易 受 感染 的 机 器 。 很 多 媒介 都 能 传播 病毒 ， 包 括 互 联网 络 和 
可 存 取 磁盘 。 为 了 实现 自 复制 的 基本 任务 ， 一 个 病毒 可 能 就 包含 递归 定理 的 证 明 中 所 描述 
的 结构 。 
现在 讨论 用 递归 定理 来 证 明 的 三 个 定理 ， 还 有 一 个 应 用 出 现在 6. 2 节 的 定理 6. 15 中 。 
首先 回 到 Ar 不 可 判定 性 的 证 明 。 以 前 在 定理 4. 9 中 曾 用 康 托 对 角 化 法 证 明 过 它 ， 递 
归 和 定理 提供 了 一 个 新 的 、 更 简单 的 证 明 方 法 。 
ATM 是 不 可 判定 的 。 
证 明 为 了 得 到 矛盾 ， 假 设 图 灵机 瓦 可 判定 ArM。 构 造 下 列 图 灵机 B。 
B 二 “对 于 输入 w: 
1. 由 递归 定理 得 到 自己 的 一 个 描述 (B). 
2. 在 输入 (Bow) 上 运行 H. 
3. 得 到 与 互相 反 的 结果 ， 即 : WR AA, MWS; WR HHS, Wes.” 
对 输入 w, BHARS HAR, PW HAA REALE Arm. LEH. i 
下 面 是 递归 定理 的 另 一 个 应 用 。 
如 果 M 是 一 个 图 灵机 ， 则 M 的 描述 (M) 的 长 度 是 描述 M 的 串 中 所 含 符号 
的 个 数 。 如 果 没 有 与 M 等 价 的 图 灵机 有 更 短 的 描述 ， 则 称 M 是 最 小 的 (minimal)。 4 
MINm=({(M)|M 是 一 个 最 小 图 灵机 ) 
MTNTM 不 是 图 灵 可 识别 的 。 
证 明 假设 图 灵机 五 枚 举 MINTM， 然 后 试图 来 得 到 矛盾 。 构 造 下 列 图 灵机 C. 
C= 二 “对 于 输入 w: 
1. 由 递归 定理 得 到 它 自己 的 一 个 描述 (CO. 
2. 运行 枚 举 器 下 ， 直 到 一 个 比 C 的 描述 更 长 的 机 器 D 出 现 。 
3. 在 输入 w 上 模拟 DD。” 
因为 MINTM 是 无 限 的 ， 故 五 的 序列 中 必定 含有 图 灵机 ， 其 描述 比 C 的 描述 更 长 。 因 
K, 的 第 二 步 最 终 将 在 某 个 图 灵机 上 终止 且 D 比 C 更 长 。 然 后 C 就 模拟 刀 ， 且 与 
之 等 价 ， 因 为 C 比 DD 短 且 与 之 等 价 ， 故 DD 不 可 能 是 最 小 的 , 但 D MEE 产生 的 序列 中 出 
现 ， 这 样 就 得 到 了 矛盾 。 a 
递归 定理 的 最 后 一 个 应 用 是 一 类 不 动 点 定理 。 函 数 的 一 个 不 动 点 (fixed point) 是 一 
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个 值 ， 隆 数 施 加 在 该 值 上 ， 得 到 的 结果 还 是 它 。 现 在 考虑 图 灵机 描述 的 可 计算 的 转换 函 
数 ， 我 们 将 证 明 : 对 任意 一 个 这 样 的 转换 ， 都 存在 一 个 图 灵机 ， 使 得 它 的 行为 不 随 这 个 转 
换 而 改变 。 这 个 定理 被 称 为 递归 和 定理 的 不 动 点 形式 。 
HEI 一 5* 是 一 个 可 计算 函数 ， 则 存在 一 个 图 灵机 下， 使 得 i:(《F)) 描 
述 一 个 与 下 等 价 的 图 灵机 。 这 里 假设 如 果 串 不 是 一 个 正确 的 图 灵机 编码 ， 那 么 它 描述 的 图 
灵机 立即 拒绝 。 
在 这 个 定理 中 ，t 起 着 转换 的 作用 ， 下 是 不 动 点 。 
WEAR 设 下 是 下 列 图 灵机 。 
FF 二 “对 于 输入 w: 
1. 由 递归 定理 得 到 它 自 己 的 一 个 描述 CF). 
2. 计算 CF) 得 到 一 个 图 灵机 G 的 描述 。 
3. 在 输入 w 上 模拟 G。” 
显然 ，(F〉 和 zt(《F))= 二 (G〉 描 述 了 等 价 的 图 灵机 ， 因 为 下 模拟 G。 a 


6.2 逻辑 理论 的 可 判定 性 

数理 逻辑 是 数学 的 一 个 分 文 ， 它 研究 数学 本 身 。 它 关心 如 下 的 问题 : 什么 是 定理 ? It 
么 是 证 明 ? 什么 是 真 ? 算法 能 判定 哪些 命题 是 真 的 呢 ? 所 有 真 命题 都 是 可 证 的 吗 ? 在 这 个 
丰富 而 迷人 的 领域 中 ， 我 们 将 接触 某 些 专题 。 

我 们 关心 的 焦点 是 这 样 的 问题 : 能 否 确定 一 个 数学 命题 是 真 还 是 假 以 及 这 种 问题 的 可 
判定 性 。 答 案 依 赖 于 命题 勾勒 的 数学 域 。 我 们 将 检查 两 个 域 : 对 于 其 中 一 个 ， 能 给 出 算法 
KA ER; 对 于 另 一 个 ， 这 个 问题 是 不 可 判定 的 。 

首先 需要 建立 一 个 精确 的 语言 来 将 这 些 问 题 形 式 化 。 我 们 的 要 求 是 能 够 考虑 如 下 数学 
命题 : 

1. VaiapVazyLpoeA (2, y>1—>2zyH Pp) | 

2. Wasbscon [ (a,bsc>>0 A n>2)—>a" +b" Hc" | 

3. Vad pyzy LpogA (2, y> 1S (azyFpAryFpt2)) | 

命题 1 称 ， 有 无 限 多 个 素数 存在 ， 在 大 约 2300 年 以 前 的 欧 几 里 得 时 代 ， 就 已 知道 这 
个 命题 是 真 的 。 命 题 2 称 为 费 马 大 定理 (Fermat's last theorem) ， 这 个 命题 在 1994 年 由 
安德鲁 .威尔士 (Andrew Wiles) 证 明 为 真 。 最 后 ， 命 题 3 称 ， 有 无 限 多 个 素数 对 9 F 
在 ， 这 被 称 为 李 生 素数 猜想 (twin prime conjecture) 。 它 到 现在 还 未 被 解决 。 

为 了 人 研究 能 否 将 确定 真 命题 的 过 程 自动 化 ， 首 先 把 命题 都 仅仅 看 作 串 ， 再 定义 一 个 语 
言 ， 这 个 语言 由 所 有 的 真 命题 组 成 ; ABA: 这 个 语言 是 否 是 可 判定 的 。 

为 了 将 之 进一步 精确 化 ， 现 在 描述 这 个 语言 的 字母 表 : 

iArV Cs Var dB ,Rei 
符号 八 ，V， 一 称 为 布尔 运算 (Boolean operation); “ C A ©” Æ S (parenthesis); 
符号 V MAHA (quantifier); 符号 x 用 来 代表 变 元 (variable); 符号 Rio Re RA 


O 素数 对 是 指 两 个 差 为 2 的 素数 。 
日 ”如 果 在 同一 个 公式 中 写 多 个 变 元 ， 使 用 符号 w, y, zR, r2, r 等 。 为 了 保持 字母 表 的 有 限 性 ， 不 罗列 所 有 
无 限 多 个 可 能 。 取 而 代 之 ， 只 罗列 变量 符号 z+， 使 用 r 串 来 指示 其 他 变 元 ， 如 zz 代表 r, rrr AR r, FF. 
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关系 (relation), 

公式 CGormula) 是 这 个 字母 表 上 的 民 构 串 。 为 完整 起 见 ， 这 里 将 概略 地 叙述 良 构 公 
式 (well-formed formula) 的 技术 上 的 定义 。 你 可 以 忽略 这 部 分 内 容 从 下 一 段 继续 ， 不 影 
m, ÉA R: C’) 的 串 是 原子 公式 (atomic formula). (hj 是 关系 符号 R; 的 元 
数 (arity)。 一 个 展 构 公式 中 所 有 出 现 的 相同 关系 符号 必须 有 相同 的 元 数 。 据 此 ， 一 个 串 
$ 如 满足 以 下 条 件 ， 则 是 一 个 公式 : 

ls ÆTT ER 

2. 具有 形式 61 Ad2 W gi Vez Od, HP di A do 是 更 小 的 公式 ; 

3. 具有 形式 3ziLgij RValg)l, HP gpi 是 更 小 的 公式 。 

数学 命题 中 的 量词 可 能 出 现在 任何 地 方 。 它 的 辖 域 (scope) 是 公式 的 如 下 部 分 : 紧 
跟 在 量词 化 变 元 后 的 一 对 括号 中 的 部 分 。 现 在 假设 所 有 公式 都 是 前 束 范 式 〈prenex normal 
form)， 即 所 有 量词 都 出 现在 公式 的 前 面 。 没有 被 量词 的 辖 域 所 约束 的 变 元 称 为 自由 变 元 
(free variable)。 没 有 上 自由 变 元 的 公式 称 为 甸子 (sentence) 或 命题 (statement), 

在 下 列 公式 中 ， 只 有 最 后 一 个 是 句子 : 

1. Ri (21) A Ro (2x1 522 5x3) 

2. Wai LR (a1) A R221 5x2 5x3) | 

3. Ym daze d23LRi (21) AR (21522523) | R 

建立 了 公式 的 语法 之 后 ， 现 在 来 讨论 它们 的 含义 。 布 尔 运算 和 量词 与 通常 的 含义 相 
同 。 为 了 确定 变 元 和 关系 符号 的 含义 ， 需 要 说 明 两 个 方面 : 一 个 是 论 域 (universe), Hit 
变 元 可 能 的 取 值 ; 男 一 个 是 将 关系 符号 指定 为 确定 的 关系 。 正 如 0. 2 节 所 描述 的 ， 关 系 是 
MEREK k THAR {TRUE, FALSE) 的 函数 。 关 系 符号 的 元 数 必 须 和 指派 给 它 的 关系 
和 元 数 一 致 。 

论 域 连同 关系 到 关系 符号 的 指派 一 起 称 为 模型 (model) 。 形 式 上 ， 我 们 说 一 个 模型 
M 是 一 个 元 组 (U ,Pi1,…,Pi)， 其 中 U 是 论 域 ，P1 到 Pe 是 指派 给 符号 R1 到 Rs 的 关系 。 
有 时 称 下 列 公式 的 集合 为 模型 语言 这些 公 式 只 使 用 此 模型 指派 的 关系 符号 ， 且 对 每 个 关 
系 符号 ， 使 用 正确 的 元 数 。 如 果 #$ 是 某 个 模型 语言 中 的 句子 ， 则 8 在 这 个 模型 中 不 为 真 就 
AK. WR p 在 模型 M 中 为 真 ， 则 说 M 是 p 的 一 个 模型 。 

如 果 你 感到 这 些 概 念 难以 理解 ， 请 将 注意 力 集 中 在 叙述 它们 的 目的 上 ， 即 我 们 想 建 立 
一 个 陈述 数学 命题 的 精确 语言 ， 使 得 我 们 能 问 : 某 个 算法 能 否 确定 哪些 是 真 命题 、 哪 些 是 
假 命 题 ? 下 面 的 例子 应 能 有 助 于 理解 。 

“amy i 4 EATV V y 上 RIi(z,y)V Ri(y,xX)]， 模型 Mi =(N,<) 是 如 下 的 模 
型 : 它 的 论 域 是 自然 数 集 ， 它 将 “小 于 或 等 于 ”关系 分 配给 符号 Roe WA gp 在 Mi 中 为 
真 ， 因 为 对 任意 两 个 自然 数 a Alb, ab Mb<a 必 有 一 个 成 立 。 但 如 果 Mi 将 “小 于 ” 关 
系 〈 而 不 是 “小 于 或 等 于 ”关系 ) 指派 给 Ri ， 则 将 不 真 ， 因 为 当 z 和 >y 相等 时 ， 它 不 
再 成 立 。 

如 果 事 先知 道 什么 关系 将 指派 给 R;， 就 可 以 使 用 这 个 关系 的 惯用 记号 来 代 苦 R, H 
按 习 惯 ， 如 果 习 惯 上 有 ， 就 使 用 中 级 记 法 而 不 是 前 缀 记 法 。 这 样 ， 对 于 模型 M, ， 可 以 将 





O 良 构 公 式 在 有 些 书 中 被 称 为 合式 公式 。 一 一 译 者 注 
O ”模型 又 被 称 为 解释 或 结构 。 
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$ 写成 WzVy [zyV yz]. = 

设 Mz 是 如 下 的 模型 : 它 的 论 域 是 实数 集 R， 且 将 关系 PLUS 指派 给 Ri ， 
Hr, AB atb=c ht PLUS(Ca,p,c) 王 TRUE， 则 M Æ g=Vydz([Ri(z.z,y)] 的 
一 个 模型 。 但 如 果 用 N 代替 R 作为 M 的 论 域 ， 则 此 句子 为 假 。 

如 同 前 一 个 例子 ， 因 为 事先 已 经 知道 加 法 关系 将 指派 给 Ri1， 故 可 将 y 写 为 Vy3x 
Latz=y] WRR Vyd2zLRi(z,z,y)]. s 

如 例 6.9 说 明 的 那样 ， 可 以 用 关系 来 表示 函数 ， 如 用 关系 代替 加 法 函数 。 类 似 地 ， 还 
可 以 用 关系 来 表示 常量 ， 像 0 和 1。 

现在 给 出 最 后 一 个 定义 ， 为 下 一 节 做 准备 。 如 果 人 是 一 个 模型 ， 这 个 模型 语言 中 所 有 
真 句 子 的 集合 称 为 AM 的 理论 系统 ， 简 称 为 理论 ， 记 为 Th(A) 。 


6.2.1 一 个 可 判定 的 理论 


数论 是 最 古老 、 最 困难 的 数学 分 支 之 一 。 许 多 关于 自然 数 及 其 加 法 和 乘法 运算 的 命题 
看 起 来 很 简单 ， 但 几 个 世纪 以 来 ， 数 学 家 对 此 都 束手无策 ， 如 前 面 提 到 的 挛 生 素数 猜想 。 

数理 逻辑 最 值得 庆贺 的 发 展 之 一 是 : 在 哥 德 尔 工作 的 基础 上 ， 丘 奇 证 明了 存在 这 样 
的 数论 命题 ， 使 得 没有 算法 能 够 判定 它 的 真 假 。 形 式 上 ， 以 CN, 十 ,X) 标记 如 下 的 模 
型 : 它 的 论 域 是 自然 数 集 93 ， 具 有 通常 的 十 和 XX 关系 。 丘 奇 证 明了 这 个 模型 的 理论 
Th(N,+,X) 是 不 可 判定 的 。 

在 研究 这 个 不 可 判定 理论 之 前 ， 先 来 介绍 一 个 可 判定 理论 。 设 CN, 十 ) 是 一 个 同样 的 
模型 ， 只 是 没有 X 关 系 。 它 的 理论 是 ThCN, 十 )， 例 如 公式 VzVYy [z 十 zx 一 y] 是 真 的 ， 
因而 是 ThON, +) 的 一 个 元 标 。 但 公式 人 y3 了 zeLz 十 zy 了] RW. AMA THN, +) 
的 一 个 元 素 。 

Th(N, +) 是 可 判定 的 。 

证 明 思 路 ”此 证 明 是 第 1 章 介 绍 的 有 穷 自 动机 理论 的 一 个 有 意思 的 、 非 平凡 的 应 用 。 
我 们 要 用 到 问题 1. 37 中 关于 有 穷 自 动机 的 如 下 事实 : 如 果 输 入 符合 某 种 特定 形式 ， 则 有 
穷 自动 机 能 够 做 加 法 。 输 入 并 行 地 描述 三 个 数 ， 方 法 是 : 用 一 个 符号 来 表示 每 个 数 中 的 一 
位 ， 此 符号 取 自 一 个 含 8 个 符号 的 字母 表 。 下 面 将 用 的 方法 是 这 个 方法 的 一 个 推广 ， 用 含 
2: 个 符 叶 的 字母 表 中 的 符号 来 表示 数 的 ; 元 组 。 

下 面 给 出 一 个 算法 ， 对 输入 为 N, +) 的 语言 中 的 句子 ， 检 查 其 在 模型 中 是 否 为 
真 。 设 

一 QliziQzzz…QziLy 
HP: Qi ,…,Q 表 示 Y 或 3 ，y 是 一 个 无 量词 的 公式 ， 且 含有 变 元 tisti HAFA OR 
1 的 每 一 个 值 i， 令 公式 $; 为 
点 = Qin Ti Qiz Zi QZILO 
XIF, go=¢d, H $1 二 yy。 

公式 $; 有 i 个 自由 变 元 ， 对 于 a1,…,a:EN, Æ pi 中 用 a1,…,ai BRETT ，… ,Xi， 

得 到 的 句子 记 为 pilai stai), 


昌 为 了 方便 ， 本 章 将 N 的 通常 定义 改变 成 (0,1,2,…})。 
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对 于 从 0 到 7 的 每 一 个 值 :， 算 法 构造 了 一 个 有 穷 自 动机 A;， 它 识别 如 下 串 的 集合 : 
这 些 串 表 示 使 上 为 真 的 数 的 i 元 组 。 算 法 先 直 接 构 造 A,， 构 造 方法 是 解 问题 1. 37 所 用 方 
法 的 推广 。 然 后 ， 对 从 /向 下 到 1 的 每 个 ;1， 它 用 A; 构造 A;-1。 最 后 ,一 旦 得 到 A。， 算 
法 就 检查 A 是 否 接受 空 串 。 如 果 接 受 ， 则 y 为 真 ， 算 法 也 就 接受 。 

证 明 对 i 汪 >0， 定 义 字 母 表 


0 0 0 0 

+i 一 ` . 9 ` . 
0 1 1 
0 1 l 


则 3; 包含 了 所 有 由 0 和 1 构成 的 i 元 列 向 量 。5; 上 的 每 个 串 表 示 ; 的 二 进 制 整数 íT 
H). 2 =L D. 其 中 L] 是 一 个 符号 。 

现在 介绍 判定 THON, +) 的 算法 。 对 于 输入 8 〈 其 中 由 为 句子 )， 算 法 如 下 运行 ， 写 
下 Y%， 且 对 从 0 到 :的 每 个 ;， 如 同 在 证 明 思 路 中 介绍 的 那样 定义 8;。 再 对 每 个 这 样 的 i 
由 $; 构造 有 穷 自 动机 A;， 使 得 只 要 点 (al …， ai) 为 真 ， 它 就 接受 3; 上 对 应 于 i 元 组 
aist sai WB. A 的 构造 如 下 : 

为 构造 第 一 个 机 器 A, HERB p= 是 原子 公式 的 布尔 组 合 。Th(N, 十 ) 的 语言 中 ， 
原子 公式 只 有 单个 加 法 。 对 每 个 这 样 的 单个 加 法 ， 可 以 构造 一 个 有 穷 自 动机 来 计算 这 样 的 
单个 加 法 所 对 应 的 关系 ， 然 后 将 这 些 有 穷 自 动机 组 合 起 来 ， 就 能 给 出 自动 机 A,。 这 样 做 
要 涉及 正则 语言 类 对 于 交 、 并 和 补 的 封闭 性 ， 以 计算 原子 公式 的 布尔 组 合 。 

接 下 来 说 明 怎 么 由 A;+1 来 构造 A;。 如 果 点 = Jari gio ME A; 使 得 它 的 运行 
几乎 与 Ai+1 一 样 ， 区 别 在 于 A: 非 确 定 地 猜 ai+i1 的 值 ， 而 不 是 将 它 作 为 输入 的 一 部 分 而 
接收 。 

更 精确 地 说 ， 对 于 Ai+1 的 每 个 状态 ，A; 包含 一 个 与 之 对 应 的 状态 ; HA 还 包含 一 个 
新 的 起 始 状 态 。 每 当 A 读 下 列 符 号 时 ， 

bı 


这 里 每 个 5;E10,1} 是 数 a; 的 某 一 位 ， 它 非 确定 地 猜测 zE {0,1;， 且 在 下 列 输 入 符号 上 
模拟 Aitio 


最 初 ，A; 非 确定 地 猜测 ai+1 的 引导 位 ， 这 些 引 导 位 对 应 于 al 到 a; 中 隐藏 的 引导 0。 猜 测 
的 方法 是 : 从 它 新 的 起 始 状态 到 所 有 状态 非 确定 性 地 使 用 e 转移 进行 分 义 ， 这些 状态 是 
Aii A 3;+1 中 下 列 符号 的 串 为 输入 、 从 它 的 开始 状态 所 能 到 达 的 所 有 状态 。 
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0 0 
ARAE: 
0 1 


WA, WRF ai+1， 使 得 Ai+l1 接 受 (ceil，…ai+l1)， 则 A; 接受 (al，…ai)。 

MR gp: = Y tiigis ESHA zi417 ditio 首先 构造 识别 语言 Ai+1 的 补 的 有 穷 
自动 机 ， 然 后 应 用 上 述 对 于 了 量词 的 构造 ， 最 后 再 一 次 应 用 补 来 得 到 A;。 

有 穷 自动 机 Ao 接受 某 个 输入 ， 当 且 仅 当 po 为 真 。 所 以 算法 的 最 后 步骤 是 检查 Ao 是 
否 接受 ee。 如 果 是 ， 则 8 为 真 ， 且 算法 接受 它 ; 否则 ， 就 拒绝 。 i 


6.2.2 一 个 不 可 判定 的 理论 


如 前 所 述 ，Th(N, 十 ,X) 是 一 个 不 可 判定 的 理论 ， 不 存在 算法 能 够 判定 数学 命题 的 
真 假 ， 即 使 限制 到 CN, 十 ,X) 的 语言 上 也 是 如 此 。 这 个 定理 在 哲学 上 具有 极 大 的 重要 性 ， 
因为 它 说 明了 数学 不 能 被 机 械 化 。 现 在 陈述 这 个 定理 ， 但 只 给 出 一 个 简短 的 证 明 概 要 。 

Th(N,+,X) 是 不 可 判定 的 。 

虽然 这 个 定理 的 证 明 包 含 很 多 细节 ， 但 在 概念 上 并 不 困难 。 它 使 用 了 第 4 章 中 介绍 的 
不 可 判定 性 证 明 的 模式 ， 即 通过 将 Arm JAB ThON, +, X) 来 证 明 Th(N, 十 , XX) 的 不 
可 判定 性 ， 也 使 用 了 计算 历史 的 方法 。 归 约 的 存在 性 依赖 于 下 列 引 理 。 

设 M 是 一 个 图 灵机 ,Ww 是 一 个 囊 ， 从 M 和 也 能 构造 (N, 十 ,X) 的 语 
言 中 的 公式 $M,w， 使 得 它 只 包含 单个 自由 变 元 Xz， 上 且 和 句子 导 XpM,w 为 真 当 且 仅 当 JM 接 
LW 

证 明 思 路 公式 pmu “W r (经 过 适当 编码 ) 是 M 在 w 上 的 一 个 接受 计算 历史 。 
HR, r 实际 上 只 是 一 个 相当 大 的 整数 ， 但 它 表 示 计 算 历 史 的 方式 可 以 使 用 十 和 X 运 算 来 
检查 。 

$M,w 的 实际 构造 太 复杂 ， 难 于 在 这 里 介绍 。 它 在 带 有 十 和 XX 运算 的 计算 历史 中 抽取 个 
体 符号 来 检查 M 在 w 上 的 起 始 格 局 是 否 正确 ， 检 查 每 个 格局 是 否 是 它 前 一 个 格局 的 合法 
转移 ， 最 后 检查 最 后 的 格局 是 否 被 接受 。 

定理 6. 11 的 证 明 下 面 给 出 一 个 从 Arw 到 ThGCN, 十 ,X) 的 映射 归 约 。 这 个 归 约 应 用 
引 理 6. 12 WA (M, w) 构造 公式 $M,w， 然 后 它 输出 句子 3 Xx$M,w。 m 

下 面 大 致 说 明 值 得 庆贺 的 哥 德 尔 (Kurt Gödels) 不 完全 性 定理 (incompleteness the- 
orem) 的 证 明 。 非 形式 地 ， 这 个 定理 称 : 任何 关于 数论 可 证 性 概念 的 形式 系统 中 都 含有 不 
可 证 的 真 命题 。 

粗略 地 说 ， 一 个 命题 $ 的 形式 证 明 (formal proof) x 是 命题 的 一 个 序列 Si ,Ss,…， 
Sı, EF S =¢, HRS S: 都 是 如 下 得 到 的 : 由 它 前 面 的 一 些 命题 和 一 些 关 于 数 的 基本 公 
理 ， 应 用 简单 而 精确 的 应 用 规则 得 到 。 为 节省 篇 幅 ， 本 书 没 有 定义 这 个 证 明 的 概念 ， 就 我 
们 的 目的 而 言 ， 关 于 证 明 的 下 面 两 个 合理 性 质 已 足够 使 用 : 

1. 命题 证 明 的 正确 性 可 以 由 机 器 来 检查 。 形 式 上 表示 ，{《($,x) |r Æ gp 的 一 个 证 明 ) 
是 可 判定 的 。 

2. 证 明 系 统 是 可 靠 的 ， 即 一 个 命题 如 果 是 可 证 的 〈 即 有 一 个 证 明 )， 则 它 为 真 。 
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如 果 一 个 可 证 性 系统 满足 这 两 个 条 件 ， 则 下 面 三 个 定理 成 立 。 
Th(N,+,X) 中 可 证 命题 的 集合 是 图 灵 可 识别 的 。 
证 明 ”如 果 $ 是 可 证 的 ， 则 下 列 算法 P 接受 其 输入 8。 算法 PP 使 用 在 可 证 性 性 质 1 中 
所 说 的 证 明 检 查 器 ， 检 查 每 个 可 能 成 为 上 的 证 明 的 候选 种 。 如 果 发 现 一 个 候选 串 正 是 一 个 
证 明 ， 则 接受 它 。 w 
现在 使 用 前 面 的 定理 来 证 明 不 完全 性 定理 。 
Th(N,+,X) 中 存在 不 可 证 的 真 命题 。 
证 明 用 反 证 法 。 假 设 所 有 真 命题 都 是 可 证 的 ， 利 用 这 个 假设 来 构造 判定 命题 是 否 为 
真 的 算法 D， 与 定理 6. 11 FH. 
对 于 输入 $5， 算法 D 如 下 运行 : 在 输入 上 和 一 # 上 并 行 地 运行 定理 6. 13 的 证 明 中 给 出 
的 算法 已 。 这 两 个 命题 总 有 一 个 为 真 ， 根 据 假设 ， 总 有 一 个 是 可 证 的 。 因 而 PP 在 其 中 一 个 
输入 上 停机 。 根 据 可 证 性 性 质 2， 如 果 8 是 可 证 的 ， 则 8 为 真 ; WR g 是 可 证 的 ， 则 8 
为 假 。 所 以 算法 D 能 判定 的 真 假 性 。 = 
作为 本 节 的 最 后 一 个 定理 ， 用 递归 定理 明确 地 给 出 CN, 十,X) 的 语言 中 的 一 个 句子 ， 
它 为 真 ， 但 却 不 可 证 。 定 理 6. 14 说 明 存 在 这 样 的 句子 ， 但 没有 像 现 在 所 做 的 这 样 ， 将 它 
实际 地 描述 出 来 。 
本 定理 的 证 明 中 描述 的 句子 Vanprovable 是 不 可 证 的 。 
证 明 思 路 ”使 用 递归 定理 得 到 自 引 用 ， 构 造 一 个 句子 ， 称 “这 个 句子 是 不 可 证 的 ”。 
证 明 设 S 是 如 下 运行 的 图 灵机 。 
S 二 “对 于 任意 的 输入 : 
1. 由 递归 定理 得 到 它 自己 的 描述 (S). 
2. 用 引 理 6. 12 构造 句子 y=] cLysoj。 
3. 在 输入 y 上 运行 定理 6. 13 给 出 的 算法 P。 
4. 如 果 上 一 步 接受 ， 就 接受 。” 
设 winprovatle 是 算法 S 的 第 二 步 所 描述 的 甸子 WV。 少 为 真 ， 当 是 仅 当 SS 不 接受 0 (HO 
随意 选择 的 )。 
如 果 S 能 找到 yunprovatie 的 一 个 证 明 ，S 就 接受 0， 这 个 句子 也 就 因 之 为 假 。 一 个 假 句 
子 是 不 能 被 证 明 的 ， 所 以 这 种 情形 不 可 能 发 生 。 剩 下 的 唯一 的 可 能 性 是 S 不 能 找到 
unprovable 的 证 明 ， 因 而 S 不 接受 0。 但 我 们 已 宣布 过 Winprovable 为 真 。 s 


6.3 图 灵 可 归 约 性 

第 5 章 引 入 可 归 约 性 概念 ， 其 核心 思想 是 利用 一 个 问题 的 解 来 解 男 一 个 问题 。 如 果 A 
可 归 约 到 B， 且 可 以 找到 B 的 一 个 解 ， 就 能 得 到 A 的 一 个 解 。 随 后 ， 又 描述 了 映射 可 归 约 
性 (mapping reducibility) ， 它 是 可 归 约 性 的 一 个 特殊 形式 。 但 映射 可 归 约 性 是 否 已 经 在 
最 广泛 的 意义 下 完全 刻画 了 可 归 约 性 的 直观 概念 呢 ? RA. 

例如 ， 考 虑 两 个 语言 Arx 和 Arwv ， 直 观 上 ， 它 们 能 够 互相 归 约 ， 因 为 它们 中 任 一 个 问 
题 的 解 都 可 被 用 来 求解 另 一 个 问题 ， 只 要 将 答案 反 过 来 即 可 。 但 是 ，Arw 不 能 映射 可 归 约 
到 Am, AX Ar 是 图 灵 可 识别 的 ， 而 Arw 却 不 是 。 现 在 将 介绍 一 种 更 广义 的 可 归 约 性 ， 
叫 作 图 灵 可 归 约 性 (Turing reducibility)， 它 更 深刻 地 刻画 了 可 归 约 性 的 直观 概念 。 
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语言 忆 的 一 个 论 示 (oracle) 是 一 个 能 够 报告 某 个 串 wLGA BARE 
的 外 部 装置 。 一 个 论 示 图 灵机 Coracle Turing machine) 是 一 种 修改 过 的 图 灵机 ， 它 有 询 
问 一 个 论 示 的 额外 能 力 。 记 MB 为 对 语言 B 有 论 示 的 论 示 图 灵机 。 
我 们 不 关心 论 示 的 内 部 工作 机 制 。 使 用 “ 论 示 ”这 个 术语 就 意味 着 一 种 神奇 的 能 力 ， 
意味 着 将 考虑 不 能 由 普通 算法 判定 的 语言 的 论 示 ， 如 下 面 例 子 所 示 。 
考虑 Ar 的 一 个 论 示 。 带 Arw 的 论 示 的 一 个 论 示 图 灵机 比 普通 的 图 灵机 能 
判定 更 多 的 语言 ， 这 样 的 图 灵机 能 够 判定 AMAR (显然 成 立 )， 它 只 要 对 输入 询问 它 的 
论 示 即 可 。 它 也 能 判定 Erw， 即 图 灵机 的 空 性 质 检 查 问 题 ， 用 的 是 下 面 称 为 Tn 的 过 程 : 
Tâm 一 “对 于 输入 (M), EFP M 是 一 个 图 灵机 : 
1. 构造 下 面 图 灵机 N: 
N= ‘SERRA: 
a. 对 >* PAA BIH TIS M. 
b. WR M 接受 它们 中 的 任何 一 个 串 ， 则 接受 。? 
2. 询问 论 示 以 确定 (N,0〉》 EATrx 是 否 成 立 。 
3. MRA A SAR’, Wee; 如 果 回 答 “ 是 ”， 则 拒绝 。” a 
如 果 M 的 语言 不 空 ， 则 NN 将 接受 每 个 输入 ， 特 别 地 ， 将 接受 0。 从 而 论 示 将 回答 
“是 ”， 且 TArw 将 拒绝 。 相 反 地 ， 如 果 M 的 语言 是 空 的 ， 则 Tam 将 接受 。 所 以 Tim 判定 
Erm, RVI ET 是 相对 于 Ar 可 判定 的 〈decidable relative)。 这 就 给 我 们 带 来 图 灵 可 归 
约 性 的 定义 。 
CSE t AART (Turing reducible) 到 B， 如 果 A 相对 于 B 是 可 判 
定 的 ， 记 作 A<Tr B. 
例 6. 17 证 明 Erm 图 灵 可 归 约 到 Artm。 图 灵 可 归 约 性 满足 可 归 约 性 的 直观 概念 ， 下 面 
定理 证 明之 。 
如 果 A 三 TB 且 B 是 可 判定 的 ， 则 A 也 是 可 判定 的 。 
证 明 ”如果 B 是 可 判定 的 ， 则 可 以 用 判定 B 的 实际 过 程 来 替换 B WM. KARA 
判定 A 的 普通 图 灵机 取代 了 判定 A 的 论 示 图 灵机 。 = 
图 灵 可 归 约 性 是 映射 可 归 约 性 的 一 个 推广 。 如 果 AS B, W A<r B， 因 为 此 映射 归 
约 可 以 被 用 来 给 出 一 个 相对 于 B 判定 A 的 论 示 图 灵机 。 
带 Ar 的 论 示 的 论 示 图 灵机 十 分 强大 ， 它 能 解 许 多 不 能 由 普通 图 灵机 解决 的 问题 。 但 
即使 是 这 样 一 个 强大 的 图 录 机 ， 也 不 能 判定 所 有 语言 (参见 练习 6. 4) 。 


6.4 信息 的 定义 


算法 和 信息 是 计算 机 科学 中 的 基本 概念 。 但 丘 奇 -图 灵 论 题 在 给 出 算法 的 广泛 而 实用 
的 定义 的 时 候 ， 却 没有 关于 信息 的 同等 广泛 的 定义 。 不 同 于 单一 而 广泛 的 定义 ， 使 用 的 是 
多 个 依据 应 用 的 定义 。 在 本 节 中 ， 用 可 计算 性 理论 来 给 出 一 个 定义 信息 的 方法 。 

以 一 个 例子 开始 。 考 虑 下 列 两 个 二 进 制 数 序列 的 信息 量 : 
A=0101010101010101010101010101010101010101 
B=1110010110100011101010000111010011010111 

BME, PUI A 包含 较 少 的 信息 ， 因 为 它 只 是 将 01 重复 了 20 次 。 相 比 之 下 ， 序 列 B 
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看 起 来 包含 了 更 多 的 信息 。 

上 例 表 明了 将 要 介绍 的 信息 定义 背后 的 思想 。 包 含 在 一 个 对 象 中 的 信息 量 将 被 定义 为 
这 个 对 象 的 最 小 表示 或 描述 的 大 小 。 对 象 的 描述 是 指 这 个 对 象 的 精确 且 无 歧义 的 特征 ， 使 
得 单 从 这 个 描述 就 能 重新 产生 那个 对 象 。 这 样 ， 序 列 A 包含 了 很 少 的 信息 ， 因 为 它 有 一 个 
很 短 的 描述 ， 然 而 ， 序 列 B 看 起 来 包含 了 更 多 的 信息 ， 因 为 它 看 起 来 没有 简明 的 描述 。 

在 确定 对 象 的 信息 量 的 时 候 ， 为 什么 只 考虑 最 短 的 描述 呢 ? 我 们 总 是 可 以 通过 在 描述 
中 放置 对 象 的 一 个 副本 的 方式 来 描述 一 个 对 象 ， 比 如 一 个 串 。 用 此 方法 ， 能 以 含 B 的 一 个 
副本 的 一 个 40 位 长 的 表 来 描述 前 面 的 串 B。 这 种 描述 永远 不 会 比 对 象 本 号 短 ， 也 不 会 告 
诉 我 们 关于 信息 量 的 任何 东西 。 但 是 ， 一 个 真 的 较 短 的 描述 蕴涵 着 包含 在 对 象 中 的 信息 可 
以 被 压缩 到 更 小 ， 所 以 信息 量 也 就 不 可 能 更 大 。 因 而 最 短 的 描述 的 大 小 决定 了 信息 量 。 

为 了 将 这 个 直观 思想 形式 化 ， 须 做 一 些 准备 。 首 先 ， 将 注意 力 集中 于 这 样 的 对 象 ， 它 
们 是 由 二 进 制 数 构成 的 串 ， 其 他 对 象 可 以 表示 为 由 二 进 制 数 构成 的 串 ， 所 以 这 个 条 件 并 没 
有 限制 理论 的 范围 。 第 二 ， 我 们 只 考虑 这 样 的 描述 ， 它 们 是 由 二 进 制 数 构成 的 串 。 利 用 这 
些 要 求 ， 可 以 很 容易 地 对 比 对 象 的 长 度 与 它 摘 述 的 长 度 。 下 节 将 考虑 所 允许 描述 的 类 型 。 


6.4.1 极 小 长 度 的 描述 


许多 类 型 的 描述 语言 可 以 用 来 定义 信息 。 选 择 使 用 什么 样 的 语言 影响 着 定义 的 特征 ， 
我 们 的 描述 语言 是 基于 算法 的 。 

用 算法 来 描述 串 的 方法 之 一 是 : 先 构造 一 个 图 灵机 ， 使 得 在 它 以 空 日 市 开始 运行 ， 就 
能 打印 出 这 个 串 ; 然后 将 此 图 灵机 本 身 也 表示 成 一 个 串 。 这 样 ， 表 示 图 录 机 的 串 就 是 原来 
那个 串 的 一 个 描述 。 这 个 方法 的 缺点 是 ， 图 灵机 不 能 用 它 的 转换 函数 简明 地 表示 信息 表 。 
表示 一 个 n 位 的 串 也 许 就 要 用 到 个 状态 和 要 有 行 的 转换 函数 表 ， 这 将 导致 一 个 相对 我 
们 的 目的 来 说 过 长 的 描述 。 因 此 使 用 下 列 更 简洁 的 描述 语言 。 

用 图 灵机 M 和 它 的 二 进 制 数 的 输入 w 来 描述 二 进 制 数 的 串 x， 描 述 的 长 度 是 表示 M 
和 ww 的 组 合 长 度 。 对 于 将 多 个 对 象 编码 成 一 个 二 进 制 数 串 (M,w)、， 采 用 第 用 的 记号 来 记 
这 个 描述 。 但 这 里 必须 格外 注意 编码 操作 “。，。，，， 因 为 产生 的 结果 必须 是 简明 的 。 方 
法 是 : TEMA (Mw) 为 《M);w， 即 直接 将 二 进 制 数 串 w 简单 连接 到 M 的 二 进 制 编码 的 
后 面 。 除 了 下 一 段 中 叙述 的 微妙 之 处 外 ，M 的 二 进 制 编码 〈“M》〉 可 以 使 用 任何 标准 方法 。 
(在 第 一 遍 阅 读 中 ， 不 要 担心 这 个 微妙 之 处 。 你 可 以 暂且 忽略 下 一 段 和 图 6-3.) 

将 w 连接 到 (M) 的 后 面 来 产生 z 的 一 个 描述 ， 如 果 《〈M》 结束 和 w 开始 的 地 方 不 
能 从 这 个 描述 自 映 分 辨 出 来 的 话 ， 那 么 将 可 能 会 遇 到 麻烦 。 如 果 这 样 ， 就 可 能 有 多 个 对 描 
$ (Mw 进行 划分 的 方法 ， 这 些 方法 都 会 产生 语法 上 正确 的 图 灵机 和 一 个 输入 ， 从 而 这 
个 描述 将 是 含糊 的 ， 因 此 也 是 无 效 的 。 用 来 避免 这 个 问题 的 方法 是 : 保证 在 〈‘M)w 中 能 
确定 〈“M》〉 和 w 的 分 界 位 置 。 做 到 这 点 的 一 种 方法 是 : 将 CMD 的 每 一 位 写 两 届 ， 即 将 0 
写成 00， 将 1 写成 11， 再 在 其 后 写 下 01 来 标记 分 界 位 置 。 图 6- 3 说 明了 这 个 思想 ， 此 图 
描绘 了 某 个 串 2 的 描述 M, w). 

SAR 
(M,w)=11001111001100---1100 01 01101011+--010 


(M) w 


图 6-3 Ro WHE (M, w) 的 格式 示例 


BOF TFHEABAH SAREE 167 


既然 已 定 下 了 描述 语言 ， 下 面 就 要 定义 一 个 测量 串 的 信息 量 的 度量 。 

Hox eH RAH BE, xc 的 最 小 描述 (minimal description) (iH 
d(x)) 是 最 短 的 串 (Mow), RP: 图 灵机 MERA w 上 停机 时 ， 工 在 带子 上 。 如 果 有 
多 个 这 样 的 串 存在 ， 则 在 其 中 选择 字典 序 下 的 第 一 个 串 。z 的 描述 复杂 性 2 (descriptive 
complexity) 记 为 K(x)， 是 

K(x) =| d(x) | 

换 句 话说 ，K (zx) 是 工 的 最 小 描述 的 长 度 。K(x) 的 定义 是 为 了 刻画 串 zx 中 的 信息 量 
这 个 直观 概念 的 。 接 下 来 ， 建 立 关 于 描述 复杂 性 的 一 些 简 单 结果 。 

jcVzx [K(x)<Iz|+e]. 

这 个 定理 称 ， 一 个 串 的 描述 复杂 性 最 多 比 它 的 长 度 多 一 个 固定 的 常量 ， 这 个 常量 是 通 
用 的 ， 即 不 依赖 于 这 个 串 。 

证 明 为 证 明 此 定理 给 出 的 K(x) 的 上 界 ， 只 需 给 出 一 个 不 长 于 这 个 上 界 的 z 的 摘 
述 。z 的 最 小 描述 可 能 比 这 个 描述 更 短 ， 但 不 会 更 长 。 

BiB x 的 下 列 描 述 。 设 M 是 这 样 一 个 图 灵机 : 它 一 启动 就 停机 。 此 图 灵机 计算 恒 
等 函数 输出 与 输入 是 一 样 的 函数 。z AR ECM ze, Oc HR (CM) 的 长 度 ， 就 
可 完成 证 明 。 z 

定理 6. 21 说 明了 怎么 使 用 图 灵机 的 输入 来 表示 这 样 的 信息 : 在 存储 而 不 是 使 用 此 图 
灵机 的 转换 函数 时 ， 此 信息 要 求 一 个 真正 大 的 描述 。 它 与 我 们 的 直 党 是 一 致 的 ， 即 一 个 串 
包含 的 信息 量 不 可 能 〈 实 质 性 地 ) 多 于 它 的 长 度 。 类 似 地 ， 直 党 也 告诉 我 们 ， 串 zz 包含 
的 信息 不 会 真 的 多 于 x 所 包含 的 信息 。 下 面 的 定理 验证 了 这 个 事实 。 

Jey z Kien kts. 

证 明 考虑 下 列 图 灵机 M， 它 要 形 如 (N,w) 的 输入 ， 其 中 N 是 一 个 图 灵机 ，z 是 
的 一 个 各 和信。 

M=“ FAA (N, w), KP N 是 一 个 图 灵机 ，w 是 一 个 串 : 

1. 在 w 上 运行 N 直到 停止 ， 且 产生 输出 串 s. 





2. Hy th BH ss.” 
zz 的 一 个 描述 是 (MD) d(x). M—F, da) 是 的 最 小 描述 ， 这 个 描述 的 长 度 是 
| <M) | 十 |d(z)|， 即 为 c 十 K(x)， 其 中 cc 是 (M) 的 长 度 。 a 


下 面 检查 串 x 和 yy 的 连接 zy 的 描述 复杂 性 与 它们 的 单个 复杂 性 间 的 关系 。 定 理 6. 21 
可 能 会 使 我 们 相信 ， 连 接 的 复杂 性 最 多 是 单个 复杂 性 的 和 “加 上 一 个 固定 的 常量 ), (AR 
际 上 组 合 两 个 描述 的 代价 是 导致 了 一 个 更 大 的 上 界 ， 如 下 面 的 定理 所 述 。 

JcY zay LK(rzy)<2K(2)+K(y) +c]. 

证 明 构造 图 灵机 M， 它 将 输入 w 拆 成 两 个 单独 的 描述 。 在 第 二 个 描述 d4(y)〉 出现 以 
前 ， 第 一 个 描述 diz) 的 所 有 位 都 被 写 两 遍 且 以 01 结束 ， 如 图 6- 3 所 示 。 在 得 到 两 个 描 
述 之 后 ， 它 们 就 开始 运行 ， 得 到 串 z y 及 产生 zy。 

RA, cy 的 这 个 描述 的 长 度 是 z 的 复杂 性 的 两 倍加 上 y 的 复杂 性 ， 再 加 上 描述 MM 的 
固定 常量 c。 此 和 为 


日 ”描述 复杂 性 有 时 也 称 柯 尔 莫 哥 洛 夫 (Kolmogorov) 复杂 性 或 柯 尔 莫 哥 洛 夫 - 伽 廷 (Kolmogorov-Chaitin) 复杂 性 。 
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2K(z) 二 + K(y)+c 

这 就 完成 了 证 明 。 wi 

可 以 用 一 个 更 有 效 的 方法 来 指出 两 个 描述 之 间 的 分 离 之 处 ， 从 而 可 以 稍微 改进 这 个 定 
理 。 这 是 一 个 避免 双 写 d(x) 的 数位 的 方法 。 用 二 进 制 整数 表示 d(x) 的 长 度 ， 但 它 已 被 
双 写 ， 使 得 它 不 同 于 d(x)。 这 个 描述 仍然 包含 足够 的 信息 来 对 之 进行 解码 ， 从 而 得 到 x 
Aly 的 描述 。 现 在 ， 它 的 长 度 最 多 为 

2log: (K(z))+K(z)+K(y)+e 
还 可 以 做 一 些 不 大 的 改进 。 但 如 问题 6. 19 所 指出 的 ， 不 能 达到 界 K(x) +K(y) +c. 


6. 4.2 定义 的 优化 


下 面 ， 在 描述 复杂 性 的 初等 性 质 的 基础 上 发 挥 某 些 直 觉 ， 来 讨论 此 定义 的 一 些 特 点 。 

在 用 算法 来 定义 描述 复杂 性 的 所 有 可 能 的 方法 中 ， 刚 才 关 于 KG) 的 定义 具有 一 个 优化 性 
质 。 假 如 将 一 般 的 描述 语言 (description language) 看 作 一 个 可 计算 因数 p:>* 一 >* ， 并 定义 工 
相对 于 zp 的 最 小 描述 为 满足 p(s) 二 xz 的 标准 字符 串 顺 序 中 的 第 一 个 串 s， 记 为 dp (xX)。 因 
E, s Er 最短 描述 按 字 典 序 排列 的 第 一 个 。 定 义 Kp(zx) 二 1dp (x)|。 

例如 ， 将 一 个 程序 设计 语言 (比如 Python (编码 成 二 进 制 数 )) 看 作 描 述 语言 ， 则 
dpython(X) 将 是 输出 x 的 最 小 Python 程序 ，Kpython (x) 将 是 这 个 极 小 程序 的 长 度 。 

下 面 的 定理 说 明 ， 任 何 此 种 类 型 的 描述 语言 都 不 会 明显 地 比 原先 定义 的 图 灵机 和 输入 
语言 更 简洁 。 

对 任何 描述 语言 p， 存 在 一 个 只 与 p 有 关 的 常量 c， 使 得 

Yel KCK, (a) +c] 

证 明 思 路 ”用 Python 例子 来 说 明证 明 思 路 。 假 设 zx 有 一 个 短 的 Python 描述 w。 令 M 
是 一 个 能 解释 Python 的 图 灵机 ， 且 以 z 的 Python 程序 w 作为 输入 。 则 (Mew) Æ zx W 
— HIRE, AEH x 的 Python 描述 只 大 一 个 固定 的 量 。 多 出 的 长 度 是 Python 解释 器 M. 

证 明 对 于 输入 语言 p， 考 虑 下 列 图 灵机 M: 


M=“xXt FRA w: 
1. 输出 p(w)。” 
WW 〈M)?dr(Cz) 是 z 的 一 个 描述 ， 它 的 长 度 至 多 比 Kl) 大 一 个 固定 常量 ， 此 第 量 为 
(M) 的 长 度 。 ™ 


6.4.3 不 可 压缩 的 串 和 随机 性 


定理 6. 21 证 明了 串 的 最 小 描述 绝 不 会 比 串 本 映 长 太 多 。 对 于 某 些 信息 稀 朴 的 串 ， 它 
们 的 描述 可 能 要 短 得 多 。 是 不 是 某 些 串 没 有 更 短 的 描述 呢 ? 换 名 话说， 是 不 是 某 些 串 的 最 
小 描述 实际 上 和 串 本 身 一 样 长 呢 ? 下 面 将 证 明 这 样 的 串 是 存在 的 。 对 于 这 些 串 ， 简 单 地 将 
它们 写 出 来 就 是 最 简洁 的 描述 。 

设 工 是 一 个 串 ， 如 果 

Kt(x=|x|—<c 

WW) AK x ec 可 压缩 的 (ccompressible)。 如 果 工 不 是 c 可 压缩 的 ， 则 称 工 是 不 可 压缩 e 的 
(incompressible by c) 。 如 果 工 是 不 可 压缩 1 的 ， 则 称 工 是 不 可 压缩 的 〈incompressible) 。 
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换言之 ， 如 果 x 有 一 个 比 它 的 长 度 短 c 位 的 描述 ， 则 z 是 c 可 压缩 的 。 否 则 ，z 是 不 
可 压缩 c 的 。 最 后 ， 如 果 z 没有 比 它 本 身 更 短 的 描述 ， 则 z 是 不 可 压缩 的 。 先 来 证 明 不 可 
压缩 的 串 是 存在 的 ， 然 后 再 讨论 它们 的 一 些 有 意思 的 性 质 。 特 别 地 ， 将 证 明 不 可 压缩 的 串 
看 起 来 就 像 是 随机 抛 硬币 得 到 的 串 。 

EDE 对 于 年 个 长 度 ， 都 存在 不 可 压缩 的 囊 。 

证 明 思路 ”长 度 为 n 的 串 的 个 数 比 长 度 小 于 的 描述 的 个 数 要 大 。 每 个 描述 最 多 描述 
一 个 串 。 所 以 某 个 长 度 为 n 的 串 不 能 由 任何 长 度 小 于 的 描述 来 描述 。 这 个 串 就 是 不 可 压 
缩 的 。 

证 明 长 度 为 对 的 二 进 制 数 串 的 个 数 是 2” ， 每 个 描述 都 是 一 个 非 空 的 二 进 制 数 串 ， 故 
长 度 小 于 nn 的 描述 的 个 数 最 多 为 长 度 小 于 等 于 nn 一 1 的 串 的 个 数 之 和 ， 即 

>) 2=1 十 2 十 4 十 8 十 十 2"1 = 2+ 一 1 


0<i<n—1 
所 以 较 短 描述 的 个 数 小 于 长 度 为 n 的 串 的 个 数 。 因 此 ， 至 少 有 一 个 长 度 为 n 的 串 是 不 可 压 
缩 的 。 a 

GAD 玉 少 有 2" 一 2"-+1 十 1 个 长 度 为 n 的 串 是 不 可 压缩 c 的 。 

证 明 在 定理 6. 26 证 明基 础 上 扩展 ， 每 个 c 可 压缩 串 的 描述 的 长 度 至 多 为 n 一 c。 这 
样 ， 最 多 有 2-1-1 个 描述 会 出 现 。 因 此 ， 长 度 为 n 的 2" 个 串 中 最 多 有 2" ‘+1 一 1 HS 
有 这 样 的 描述 。 剩 下 的 至 少 2* 一 (2**1 一 1) 个 串 都 是 不 可 压缩 c 的 。 = 

不 可 压缩 的 串 有 许多 性 质 ， 这 些 性 质 都 是 我 们 希望 随机 选择 串 所 具有 的 。 例 如 ， 可 以 
证 明 : KEX n 的 不 可 压缩 串 大 致 含有 相同 个 数 的 0 和 1。 长 度 为 n 的 串 可 能 含有 连续 为 
0 的 子 串 ， 这 种 子 串 的 最 大 长 度 大 致 为 logz2n， 这 些 正如 我 们 希望 在 随机 串 中 发 现 的 那样 。 
证 明 这 样 的 命题 将 把 我 们 带 到 远离 主题 的 组 合 数学 和 概率 论 ， 但 下 面 将 证 明 的 定理 构成 这 
些 命题 的 基础 。 

这 个 定理 表明 ， 对 于 任何 可 计算 性 质 ， 如 果 它 对 “几乎 所 有 ”的 串 都 成 立 ， 则 对 所 有 
足够 长 的 不 可 压缩 串 也 成 立 。 如 0. 2 节 提 到 的 那样 ， 关 于 串 的 一 个 性 质 就 是 一 个 简单 函数 
f， 它 将 串 映射 到 {TRUE, FALSE), WMRKEW n, (HA FALSE 的 串 所 占 的 部 分 在 n 
增 大 时 趋向 于 0， 就 说 一 个 性 质 对 几乎 所 有 串 成 立 。 一 个 计算 性 质 如 果 对 几乎 所 有 的 串 都 
成 立 ， 则 对 随机 选择 的 长 串 也 可 能 成 立 。 因 此 随机 串 和 不 可 压缩 串 都 有 这 样 的 性 质 。 

(垂下 罗 胸 起 ” 设 / 是 一 个 对 几乎 所 有 串 成 立 的 性 质 ， 则 对 任意 0 之 0， 性 质 厂 只 在 有 限 
多 个 不 可 压缩 6 的 事 上 的 值 是 FALSE。 

证 明 设 M 是 下 列 算法 : 

M=“ FA i， 其 中 i 是 一 个 二 进 制 整数 . 

1. 在 标准 字符 串 顺序 下 ， 找 到 使 得 f(s) =FALSE 的 第 ;个 串 s。 
2. 输出 串 so” 

可 以 用 M 来 得 到 不 具有 性 质 f 的 串 的 更 短 描述 ， 方 法 如 下 : 设 工 是 这 样 的 串 ， 将 所 
有 不 具有 性 质 三 的 串 排 成 一 个 序列 ， 序 列 是 按 字符 串 顺 序 排 序 〈 即 ， 按 长 度 排列 ， 对 同一 
长 度 的 按 字典 序 排列 ) 。 令 LE r 在 这 个 序列 中 的 位 置 或 序 标 (index)。 则 (M,iz》 Æ f 
的 一 个 描述 。 这 个 描述 的 长 度 为 |iz| 十 c， 其 中 c 是 〈M) 的 长 度 。 因 为 没有 性 质 fh BR 
少 ， 故 z 的 序 标 是 小 的 ， 它 的 相应 描述 也 是 短 的 。 

{ERR O>0. E n, HE: 在 所 有 长 度 小 于 或 等 于 n WB, BAA 1/2s* 1! 不 具 
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有 性 质 f。 所 有 足够 大 的 n 都 满足 这 个 条 件 ， 因 为 了 对 几乎 所 有 的 串 成 立 。 令 工 是 长 度 为 
n 的 没有 性 质 f 的 串 ， 长 度 小 于 等 于 n WRA 2"! 一 1 个， 因此 ， 


l De 一] is 
ix rF 2" b—c 
Am liz|\<n—b—c, w (Miz) 的 长 度 至 多 为 (nn 一 6 一 0) 十 c= 二 n 一 6。 这 意味 着 
K(x) S< ab 
这 样 ， 使 得 不 具有 性质 f 的 每 个 足够 长 的 x 都 是 可 压缩 2 的 。 因 此， 只 有 有 限 多 个 不 具有 
性 质 f 的 串 是 不 可 压缩 b 的 。 证 毕 。 a 


现在 是 展示 一 些 不 可 压缩 串 的 适当 时 候 了 。 但 如 问题 6. 16 所 要 求证 明 的 那样 ， 复杂 
性 测度 KK 是 不 可 计算 的 。 而 且 ， 根 据 问 题 6.17， 没 有 算法 能 够 一 般 性 判定 串 是 不 是 不 可 
压缩 的 。 确 实 ， 根 据 问题 6.18， 它 们 没有 无 限 子 集 是 图 灵 可 识别 的 ， 所 以 没有 办 法 得 到 长 
的 不 可 压缩 串 ， 即 使 有 ， 也 没有 办 法 来 检查 这 个 串 是 不 是 不 可 压缩 的 。 下 面 的 定理 描述 了 
一 些 几 乎 是 不 可 压缩 的 串 ， 但 它 也 没有 提供 明确 的 展示 方法 。 
存在 常量 5， 使 得 对 每 个 囊 zx， 工 的 最 小 描述 d(z) 都 是 不 可 压缩 6 的 。 
证 明 考虑 下 列 图 灵机 ME 
M 二 “对 于 输入 〈‘R，y);， 其 中 R 是 一 个 图 灵机 ，y 是 一 个 串 : 
1. 在 y 上 运行 R， 且 在 它 的 输出 不 具有 形式 〈“S,z〉 时 ， 拒 绝 。 
2. Æ z 上 运行 S， 且 将 它 的 输出 放 在 带子 上 后 停机 。?” 
令 8 为 |(M)| 十 1， 证 明 2 满 足 本 和 定理。 如 不 然 ， 则 对 某 个 串 r, dlr) 是 2 可 压缩 
的 。 从 而 | 
|d(d(x))|<|d(x)|—b 
但 (M)d(d(z)) 是 工 的 一 个 描述 ， 它 的 长 度 至 多 为 
| <M) | +|d(d(x))|<(@—1) + (d(x) | —b) =|d(z)|—-1 


x 的 这 个 描述 比 4d(x) 更 短 。 这 与 后 者 的 最 小 性 矛盾 。 a 
练习 
6.1 用 一 个 实际 的 程序 设计 语言 〈 或 它 的 一 个 合理 的 近似 ) 写 一 个 本 质 上 反映 递归 定理 的 例子 ， 它 
将 其 自身 打印 出 来 。 


6.2 WH: MINTx 的 任何 无 限 子 集 都 不 是 图 灵 可 识别 的 。 

A6.3 WH: 如 果 A 二 TB 且 BTC， 则 A<KTC. 

6.4 设 Arwv=({((M,uw)|M 是 一 个 论 示 图 灵机 ，MTrw 接 受 串 w). 证明: A4w 相 对 Atm 是 不 可 判定 的 。 
A6.5 MAIV ylr+y=y] 是 否 为 ThCN, 十 ) 的 成 员 ? WHA? Iry y[zx 十 y= 二 zx] 呢 ? 


6.6 对 每 个 m>1, > Zm={0,1,2, s m— 1}, HOFm=(Zn,+.X) 是 如 下 模型 : 它 的 论 域 是 Zn, 
它 有 对 应 于 模 m 计算 的 十 和 X 关 系 。 证 明 : 对 每 个 mm， 理论 Th(F,) 是 可 判定 的 。 
6.7 证 明 : 对 于 任意 两 个 语言 A 和 B， 存 在 语言 JE4A<rJ HBS. 
6.8 WHR: 对 任意 语言 4， 存在 语言 B， 使 得 A<rB ABA. 
"6.9 证 明 : 存在 两 个 语言 A 和 B 是 图 灵 不 可 比 的 ， 即 使 得 A {BHB rA. 
*6.10 设 A 和 B 是 两 个 不 交 的 语言 。 如 果 ACC 有 目 BCC， 则 称 语言 C 分离 A 和 B。 描 述 两 个 不 交 的 图 
灵 可 识别 语言 ， 使 得 它们 不 可 由 任何 的 可 判定 语言 分 离 。 
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6.11 证 明 EQrv 可 由 一 个 带 Arw 的 论 示 的 图 灵机 识别 。 

6.12 在 推论 4.15 中 ， 我 们 证 明了 所 有 语言 构成 的 集合 是 不 可 数 的 。 利 用 这 个 结果 证 明 : 存在 不 可 由 
带 Ar 的 论 示 的 论 示 图 灵机 来 识别 的 语言 。 

6.13 回忆 一 下 5.2 节 定 义 的 波斯 特 对 应 问题 及 其 相关 的 语言 PCP。 证 明 PCP 相对 于 Arm 是 可 判 
定 的 。 

6.14 说 明 怎 么 使 用 Arw 的 论 示 来 计算 串 的 描述 复杂 性 KC). | 

6.15 使 用 问题 6. 14 的 结论 来 给 出 一 个 相对 于 Ara 的 论 示 是 可 计算 的 函数 f， 使 得 对 每 一 个 n，f(n) 
是 一 个 长 度 为 n 的 不 可 压缩 串 。 

6.16 证 明 函 数 K(x) 不 是 可 计算 函数 。 

6.17 证 明 不 可 压缩 串 的 集合 是 不 可 判定 的 。 

6.18 证 明 不 可 压缩 串 的 集合 不 包含 无 限 的 图 灵 可 识别 子 集 。 

6.19 证 明 : 对 任意 c, FER zx My, PEG Kry) >K) tK +c. 

6.20 i S={(M)|MB—+ ARPA LOM) ={(M)}}. TER SMS 都 不 是 图 灵 可 识别 的 。 

6.21 it RON‘ 是 一 个 & 元 关系 。 如 果 可 以 给 出 一 个 带 & 个 自由 变 元 xz1，… ,zk WAR g 使 得 对 所 有 
arsa EN, g (aista) 只 在 as. a CREWE, WER RETON, +) 中 是 可 定义 的 
(definable)。 证 明 下 述 每 个 关系 在 ThCN, 十 ) 中 是 可 定义 的 。 

Aa, Ro = {0} 

-R ={1} 

Ac, R= ={(a,a)|a€N} 

d. Re ={(a,b)|a,bENItH a<b) 

6.22 描述 两 个 不 同 的 图 灵机 M 和 N， 使 得 以 任意 输入 开始 时 ，M 输 出 (N), H NN 输出 《MD)。 

6.23 在 递归 定理 的 不 动 点 形式 〈 定 理 6.6) 中 ,， 令 变换 上 是 互 换 图 灵机 描述 中 的 状态 gs。 和 drejet íF 
到 的 函数 。 给 出 zt 的 不 动 点 的 一 个 例子 。 

* 6.24 EH: EQru%,EQru. 
A6.25 用 递归 定理 给 出 问题 5. 16 中 赖 斯 定理 的 另 一 种 证 明 。 
^6.26 给 出 下 列 句子 的 一 个 模型 : 
$ea 一 YZLRICzZz)j 
A VzyLRiCzyy)e>RICy,Z) | 
A Vasyo2LCRi lzy) A Ri Cysz)) ~ Ri (2,2) ] 
6.27 iW pa 如 问题 6. 26 所 定义 ， 给 出 下 列 句 子 的 一 个 模型 ; 
pit = peq 
A VasyLRi(asy) >n R: (xz,y)] 
A Vzyl Rix,y) > (Ri (zy) OD R: (y,2)) J 
A VasyezLCRe(a,y) A Ro Cyoz)) > R: (z,z)] 
A VxdyLRo(x,y) | 
46.28 it (N,<) 是 有 论 域 N 和 “小 于 ”关系 的 模型 ， 证 明 THON,<) 是 可 判定 的 。 
习题 选 解 
6.3 it M? He A, MS 判定 已 。 用 论 示 图 灵机 Ma ， 使 得 Ms 判定 A。 机 器 Ms 模拟 M, HM 向 


它 的 论 示 查询 串 s, DLA Ms 检验 是 否 zx€E B 并 将 结果 提供 给 Mi。 因为 Ms 没有 BW im AA BE 
直接 执行 检验 ， 因 此 它 在 输入 x 上 模拟 Ms 以 获得 那些 信息 。 因 为 机 器 Ms 和 M 使 用 相同 的 论 
示 C， 因 此 Ms 能 获得 Ms 直接 查询 的 结果 。 
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6.5 


6. 21 


6. 25 


6. 26 


6. 28 


BRAD 可 计算 性 理论 


mM IY ylat+y=y)] 是 Th(N, 十 ) 的 成 员 ， 因 为 在 论 域 N 上 关于 “十 ”的 标准 解释 下 ， 这 个 命 
题 是 真 的 。 回 忆 我 们 在 本 章 中 令 N=({0,1,2,…}， 故 可 取 z=0。3 了 zyVyLz++y=z] 不 是 Th 
CN, 十 ) 的 成 员 ， 因 为 命题 对 这 个 模型 不 再 是 真 的 。 比 如 ，z 取 论 域 中 的 任意 值 ，y 二 1， 都 会 引 
起 xz 十 y 王 并 为 假 。 
a. Ro 在 ThCN, 十 ) 中 是 可 定义 的 ， 因 为 $o (zx) 二 VY ylr+y=y]. 
c R= 在 Th(N, 十 ) 中 是 可 定义 的 ， 因 为 $= (u,v) 二 VzLgo(z) 一 zx 十 u 二 vj]。 
用 反 证 法 。 假 设 有 图 灵机 X 判定 性 质 P，P 满足 赖 斯 定理 的 条 件 。 这 些 条 件 中 有 一 条 如 下 : 存在 
图 灵机 A 和 B, WE (AEPH (B)4P。 用 A 和 B 构造 图 灵机 R: 
R=“ 在 输入 w 上 : 

1. 使 用 递归 定理 获得 自己 的 描述 〈R).， 

在 《RY EBTK. 

3. 如 果 X HS (R), 在 w 上 模拟 B。 如 果 XE% (R), Ew ERWA.” 

如 果 〈‘R)EP， 那 么 接受 (R) ALCR)=L(B). BÆ (DEP, 5 (RE 矛盾， 因为 也 
和 图 灵机 有 相同 的 语言 。 如 果 〈R) 和 多 已 ， 我 们 得 到 一 个 类 似 的 了 矛盾。 因此， 我 们 的 初始 假设 是 错 
误 的 ， 每 个 满足 赖 斯 定理 的 条 件 的 性 质 是 不 可 判定 的 。 
命题 ga 用 等 号 关系 给 出 三 个 条 件 。 模 型 (A,R) 是 pes 的 一 个 模型 ， 其 中 A 是 任何 域 ，Ri 是 A 
上 的 等 价 关 系 。 例 如 ，A 是 整数 域 Z，Ri ={(z)|1iEZ) 就 是 一 个 模型 。 
把 THN, <) 归 约 到 Th(N, 十 )， 这 我 们 已 经 证 明 是 可 判定 的 。 证 明 如 何 把 N, 的 语言 上 的 
句子 加 转换 成 (N, 十 ) 的 语言 上 的 句子 $2 ， 当 它们 在 各 自 的 模型 中 同时 保持 真 或 假 。 对 $1 中 i 一 
i 的 每 个 出 现 ， 用 p 中 的 公式 k[ (i 十 k= 二 7) 人 A (k 十 k 关 &)]」 代 苦 ， 这 里 的 每 次 都 是 不 同 的 变量 。 

句子 多 与 句子 如 是 相等 的 ， 因 为 “i 小 于 ;7” 意 味 着 我 们 对 i 增加 一 个 非 0 值 就 能 得 到 7。 判 
定 THON, +) 的 算法 需要 把 p 写成 前 束 范式 ， 需 要 一 点 点 额外 工作 。 新 的 存在 量词 带 到 了 句子 的 
前 面 ， 为 此 ， 这 些 量词 必须 穿 过 句子 中 出 现 的 布尔 运算 。 量 词 穿 过 八 和 V 时 不 改变 ， 而 穿 过 一 时 
3 变 为 VY ，V 变 为 3 。 这 样 一 3 ky 变 成 等 价 的 表达 式 Yk 一 yy， 一 VY ky 变 成 Jk 一 y。 
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如 果 求 解 一 个 问题 需要 过 量 的 计算 资源 〈 时 间或 存储 量 )， 那 么 即使 它 在 理论 上 是 可 
判定 的 ， 实 际 上 它 仍 然 可 能 是 不 可 解 的 。 本 书 的 最 后 这 一 部 分 介绍 计算 复杂 性 理论 一 一 一 
门 研究 求解 计算 问题 所 需要 的 时 间 、 存 储量 或 者 其 他 资源 的 理论 。 先 从 时 间 开 始 。 

本 章 旨 在 介绍 时 间 复 杂 性 理论 的 基础 知识 。 首 先 要 介绍 一 种 度量 求解 问题 时 所 需 时 间 
的 方法 ， 然 后 介绍 怎样 根据 所 需要 的 时 间 来 给 问题 分 类 ， 最 后 讨论 菏 些 可 判定 问题 需要 耗 
费 极 大 量 时 间 的 情况 ， 以 及 当 遇 到 这 样 的 问题 时 该 怎样 识别 它们 。 


7.1 度量 复杂 性 


考察 下 列 例子 。 语 言 A 二 40*1*|k 宇 0;。 显 然 A 是 一 个 可 判定 的 语言 。 单 带 图 灵机 需 
要 多 少时 间 来 判定 A 呢 ?” 考 察 下 面 判 定 A 的 单 带 图 灵机 Mi 。 我 们 给 出 该 图 灵机 的 低级 描 
述 ， 包 括 读 写 头 在 带子 上 的 实际 运动 ， 从 而 可 以 计算 出 Mi 运行 时 所 经 过 的 步 数 。 

M 一 “对 输入 串 w: 

1. 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

2. 如 果 带 子 上 既 有 0 也 有 1， 就 重复 下 一 步 。 

3. Aint. Meti 和 一 小 1， 

4. 如 果 所 有 1 都 被 删除 以 后 还 有 0， 或 者 所 有 0 都 被 删除 以 后 还 有 1， 就 拒绝 。 
否则 ， 如 果 在 带子 上 既 没 有 剩 下 0 也 没有 剩 下 1, MHS.” 

我 们 将 分 析 判 定 A 的 图 灵机 Mi 的 算法 所 需 的 时 间 。 对 此 ， 首 先 介 绍 一 些 术语 和 
Wie 

在 一 个 特定 的 输入 上 ， 算 法 所 使 用 的 步 数 可 能 与 若干 参数 有 关 。 例 如 ， 如 果 输 入 是 一 
个 图 ， 则 步 数 可 能 依赖 于 图 的 结 点 数 、 边 数 和 最 大 度数 ， 或 者 这 些 因 素 的 组 合 ， 或 者 它们 
与 其 他 因素 的 某 种 组 合 。 为 了 简单 起 见 ， 把 算法 的 运行 时 间 纯 粹 作为 表示 输入 字符 串 的 长 
度 的 函数 来 计算 ， 而 不 考虑 其 他 参数 。 在 最 坏 情 况 分 析 (worst-case analysis) 中 ， 即 这 里 
考察 的 形式 ， 考 虑 在 某 特定 长 度 的 所 有 输入 上 的 最 长 运行 时 间 。 在 平均 情况 分 析 (aver- 
age-case analysis) 中 ， 考 虑 在 某 特定 长 度 的 所 有 输入 上 的 运行 时 间 的 平均 值 。 

令 M 是 一 个 在 所 有 输入 上 都 停机 的 确定 型 图 灵机 。M 的 运行 时 间 
(running time) 或 者 时 间 复 杂 度 (time complexity) 是 一 个 函数 f:N>N, HPN LER 
RHE, fna) 是 MM 在 所 有 长 度 为 nn 的 输入 上 运行 时 所 经 过 的 最 大 步 数 。 若 fn) 是 
M 的 运行 时 间 ， 则 称 M 在 时 间 fn) 内 运行 ，M 是 f(n) 时 间 图 灵机 。 通 常 使 用 nn 表示 
输入 的 长 度 。 


7.1.1 KO 和 小 o 记 法 


因为 算法 的 精确 运行 时 间 通 常 是 一 个 复杂 的 表达 式 ， 所 以 一 般 只 是 估计 它 的 趋势 和 级 
别 。 通 过 一 种 被 称 为 渐 近 分 析 (asymptotic analysis) 的 方便 的 估计 形式 ， 可 以 试图 了 解 
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算法 在 长 输入 上 的 运行 时 间 。 为 此 ， 只 考虑 算法 运行 时 间 的 表达 式 的 最 高 次 项 ， 而 忽略 该 
项 的 系数 和 其 他 低 次 项 ， 因 为 在 长 输入 上 ， 最 高 次 项 的 影响 相 比 其 他 项 占据 主导 地 位 。 

MA, Kr fCin) =bn? + 2n?+20n+45 有 四 项 ， 最 高 次 项 是 6m3 。 忽 略 系数 6， 称 太 
渐 近 地 不 大 于 ?3 。 表 达 这 种 关系 的 渐 近 记 法 Casymptotic notation) 或 大 O 记 法 (big- 
O notation) Æ Fz) 王 OG2)。 在 下 面 的 定义 中 ， 把 这 一 概念 形式 化 。 令 R 是 大 于 0 的 实 
数 集 。 

设 f 和 g 是 两 个 函数 1，g:N>R+ 。 称 f(n) 一 Ol(g(n))， 若 存在 正 整 数 
c 和 no， 使 得 对 所 有 n>n A 

f(n)<cg(n) 

当 f(n)=Olg(n)) 时 ， 称 g(2) 是 f(n) 的 上 界 (upper bound)， 或 更 准确 地 说 ， 
g(n) 是 f(n) 的 渐 近 上 界 (asymptotic upper bound) ， 以 强调 没有 考虑 常数 因子 。 | 

直观 地 讲 ，f(n) 二 Ol(g(n)) 意味 着 如 果 和 忽略 一 个 常数 因子 的 差别 ， 那 么 f 将 小 于 或 
者 等 于 g。 可 以 把 O 看 作 代表 一 个 隐藏 的 常数 。 在 实践 中 ， 大 部 分 可 能 磁 到 的 函数 了 都 有 
一 个 明显 的 最 高 次 项 h。 在 这 种 情况 下 ， 写 成 f(n) 二 Ol(g(n))， 这 里 g 是 不 带 系数 的 h。 

UPAD i fi(n) 是 函数 5m 十 2n? 十 22n 十 6。 保 留 最 高 次 项 5z3 ， 并 且 舍 去 它 的 系 
数 5， 得 到 fi(n)= 二 O(ni)。 

验证 一 下 这 个 结果 是 否 满足 上 面 的 形式 定义 。 为 此 令 c 等 于 6，no 等 于 10， 则 对 于 所 
有 ?之 10， 有 513 十 222 +22n+6<6n', 

Wor, A a= On AAn' hn K 所 以 它 也 是 万 的 一 个 渐 近 上 界 。 

BÆ, film) 不 等 于 OC’). BIA c 和 no 赋 什 么 值 ， 始 终 不 能 满足 定义 的 要 求 。 E 

TEID 大 0O 记 法 以 一 种 特别 的 方式 与 对 数 相 互 影响 。 通 常 写 对 数 时 必须 指明 基数 
(或 称 为 对 数 的 底 )， 如 工 二 log2n。 这 里 基数 2 表明 该 等 式 等 价 于 等 式 27 =n, login 的 值 随 
着 基数 b 的 改变 而 乘 以 相应 的 常数 倍 ， 因 为 有 恒等式 logn =logen / log26。 所 以 ， 写 fn) = 
O(logn) 时 不 必 再 指明 基数 ， 因 为 最 终 要 忽略 常数 因子 。 

A fo(n) 是 图 数 3nlogzn 十 5nlogzlogzn 十 2。 此 时 有 fo(n) =O(nlogn), AW logn HE 
log logn 更 占 文 配 地 位 。 

大 O 记 法 也 可 以 出 现在 算术 表达 式 中 ， 如 表达 式 f(n) =O(n?) tOn). EAS O 
的 每 一 次 出 现 都 代表 一 个 不 同 的 隐蔽 的 常数。 因为 Ol(m*) HE On) 更 占 支 配 地 位 ， 所 
以 该 表达 式 等 价 于 Fa) 王 O(G22 ) 。 当 符号 O 出 现在 如 表达 式 f(n) = 20% 中 的 指数 上 时 ， 
含义 也 一 样 。 该 表达 式 代 表 2” 的 一 个 上 界 ， 其 中 c 是 某 个 常数 。 

在 某 些 分 析 中 会 出 现 表 达 式 f(n) = 2008 。 由 恒等式 nn 一 28z* 得 n= 二 282*， 可 以 看 
出 20Qoem 代表 nn: 的 一 个 上 界 ， 其 中 性 是 和 常数。 表达 式 m2 中 以 男 一 种 方式 代表 了 同样 的 界 ， 
因为 表达 式 OO) 代表 不 超过 某 个 固定 常数 的 值 。 

RNAS HIB NA, BP c 是 大 于 0 的 常数 。 这 种 界 称 为 多 项 式 界 (polynomi- 
al bound) 。 形 如 2(” ) 的 界 当 6 是 大 于 0 的 实数 时 ， 称 为 指数 界 (exponential bound), 

与 大 O 记 法 相伴 的 有 小 o 记 法 (small-o notation), K O 记 法 指 一 个 函数 渐 近 地 不 大 
于 另 一 个 图 数 。 要 说 一 个 函数 渐 近 地 小 于 另 一 个 图 数 ， 则 用 小 o 记 法 。 大 0 与 小 o 记 法 的 
区 别 类 似 于 二 与 二 之 间 的 区 别 。 

设 f 和 g 是 两 个 函数 1/，g:N>R”。 如 果 
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则 称 f(n)=olg(n)). REZ, f(M=olg(n)) 意味 着 对 于 任何 实数 c 盖 0， 存 在 一 个 数 
no， 使 得 对 所 有 nn, f(n)<cg(n). 

容易 验证 下 面 的 等 式 。 
. vn =o(n) 


.n=o(nlog(log n)) 





. nlog(log n) =o(nlog n) 
nlog n=o(n? ) 
n? 一 0(723 ) 


BE, a) 不 会 等 于 oC(f(n))。 si 


7.1.2 分 析 算 法 


本 小 节 分 析 语 言 A={(081* |k>0) 对 应 的 图 灵机 算法 。 为 了 便于 阅读 ， 这 里 重 述 一 遍 
此 算法 。 

Mi 二 “对 输入 串 w: 

1. 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

2. 如 果 带 子 上 既 有 0 也 有 1， 就 重复 下 一 步 。 

3. HAET: MET oMr L 

4. 如 果 删 除 所 有 1 后 还 有 0， 或 者 所 有 0 都 被 删除 以 后 还 有 1, Mee. HM, 
如 果 在 带子 上 既 没 有 剩 下 0 也 没有 剩 下 1, MHZ.” 

为 了 分 析 Mi ， 把 它 的 四 个 步骤 分 开 来 考虑 。 步 又 1 中， 机 器 扫描 带子 以 验证 输入 的 
形式 是 0* 1* 。 执 行 这 次 扫描 需要 n 步 。 如 前 面 约定 的 ， 通 常用 nn 表示 输入 的 长 度 。 将 读 
写 头 重新 放置 在 带子 的 左 端 男 外 需要 n 步 。 所 以 这 一 步骤 总 共 需 要 2n 步 。 用 大 O 记 法 ， 
称 这 一 阶段 需要 OM 步 。 注 意 ， 在 机 器 描述 中 没有 提 及 重新 放置 读 写 头 的 操作 。 渐 近 记 
法 允许 在 机 器 描述 中 忽略 那些 对 运行 时 间 的 影响 不 超过 和 常数 倍 的 操作 细节 。 

在 步骤 2 和 3 中 ， 机 器 反复 扫描 带子 ， 在 每 一 次 扫描 中 删除 一 个 0 和 一 个 1。 每 一 次 
扫描 需要 O(n) 步 。 因 为 每 一 次 扫描 删除 两 个 符号 ， 所 以 最 多 扫描 n/2 w. THER 2 和 
3 需要 的 全 部 时 间 是 (n/2)O(n)= 二 Om?) 步 。 

在 步骤 4 中 ， 机 器 扫描 一 次 来 决定 是 接受 还 是 拒绝 。 这 一 步 需要 的 时 间 最 多 是 O(n). 

所 以 ，Mi 在 长 度 为 n 的 输入 上 总 共 耗 时 为 O(n) 十 Om?) 十 Ol(n)， KOC’), RAZ, 
它 的 运行 时 间 是 O(mw? )。 这 就 完成 了 对 该 机 器 的 时 间 分 析 。 

为 了 根据 时 间 需 求 来 给 语言 分 类 ， 下 面 定 义 一 些 记 法 。 

4-t:N>R* 是 一 个 函数 。 定 义 时 间 复 杂 性 类 (time complexity class) 
TIME(t(n)) 为 由 Oli(n)) 时 间 的 图 灵机 判定 的 所 有 语言 的 集合 。 

回忆 语言 A 二 {0*1*|k 宇 0;y。 前 面 的 分 析 表 明 ， 因 为 M 在 时 间 O(n?) 内 判定 A， 而 
TIME(n?) 包括 所 有 在 时 间 On?) 内 可 以 判定 的 语言 ， 所 以 AC TIME(n?)。 

是 否 存在 渐 近 更 快 地 判定 A 的 机 絮 呢 ? 换 言 之 ， 是 否 对 于 某 个 ti(n) 二 on*)，A 属于 
TIME(t(n))? 在 每 一 次 扫描 中 删除 两 个 0 和 两 个 1， 而 不 仅仅 是 各 一 个 ， 就 可 以 减少 运行 


on A WH N KF 


B7F MAA 177 


时 间 ， 因 为 这 么 做 把 扫描 次 数 减 少 了 一 半 。 但 是 这 样 只 使 得 运行 时 间 提 高 了 2 倍 ， 不 影响 
渐 近 运行 时 间 。 下 面 的 机 器 Mo 采用 不 同 的 方法 ， 可 以 渐 近 更 快 地 判定 A。 它 表明 AE 
TIME(n log n). 

M: = “xt HT ARB w: 

| . 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

. 只 要 在 带子 上 还 有 0 和 1， 就 重复 下 面 的 步骤 。 
. 扫描 带子 ， 检 查 剩余 的 0 和 1 的 总 数 是 偶数 还 是 奇数 。 知 是 奇数 ， 就 拒绝 。 
. 再 次 扫描 带子 ， 从 第 一 个 0 开始 ， 隔 一 个 删除 一 个 0; 然后 从 第 一 个 1 开始 ， 
隔 一 个 删除 一 个 1。 
5. 如 果 带 子 上 不 再 有 0 和 1， 就 接受 。 否 则 ， 拒 绝 。” 

在 分 析 M: 之 前 ， 先 来 验证 它 的 确 可 以 判定 A。 在 步骤 4 中 ,， 每 执行 一 次 扫描 ， 剩 余 
的 0 的 总 数 就 减少 一 半 ， 其 他 的 0 被 删 了 除了。 因此， 如果 开 始 时 有 13 个 0， 那么 在 步骤 4 
执行 一 次 以 后 就 只 剩 下 6 个 0。 随后 每 次 执行 分 别 剩 下 3 个 、1 个 和 0 个 0。 该 步骤 对 1 的 
数目 有 同样 的 效果 。 

现在 来 检查 在 每 次 执行 步骤 3 时 0 和 1 的 数目 的 奇偶 性 。 再 次 假定 开始 时 有 13 个 0 
和 13 个 1。 第 一 次 执行 步骤 3 时 ， 有 奇数 个 0〈 因 为 13 是 奇数 ) 和 奇数 个 1， 以 后 每 次 执 
行 时 分 别 只 剩 下 偶数 个 〈6 个 ) 、 然 后 是 奇数 个 〈3 个 ) 、 又 是 奇数 个 人 1 个 ) 0 和 1。 由 于 
步骤 2 指定 的 循环 条 件 ， 当 剩 下 0 个 0 或 0 个 1 时 ， 步 又 3 不 再 被 执行 。 对 于 得 到 的 奇偶 
序列 〈 奇 、 偶 、 奇 、 奇 )， 如 果 把 偶 蔡 换 成 0， 把 奇 替换 成 1， 并 且 反 排 这 个 序列 ， 就 得 到 
1101， 即 13， 这 是 开始 时 0 和 1 的 数目 的 二 进 制 表示 。 该 奇偶 序列 总 是 以 反 排 的 方式 给 出 
二 进 制 表示 。 

当 步 又 3 检查 剩 下 的 0 和 1 的 总 数 是 偶数 时 ， 实 际 上 是 在 检查 0 数目 的 奇偶 性 与 1 数 
目的 奇偶 性 是 否 一 致 。 如 果 这 两 个 奇偶 性 始终 一 致 ， 那 么 0 和 1 的 数目 的 二 进 制 表示 就 一 
致 ， 从 而 这 两 个 数目 就 相等 。 

为 了 分 析 M: 的 运行 时 间 ， 首 先 注意 ， 每 一 步骤 都 消耗 O(n) 的 时 间 ， 然 后 确定 每 
一 步骤 需要 执行 的 次 数 。 步 又 1 和 5 执行 一 次 ， 共 需要 OM 的 时 间 。 步 骤 4 在 每 一 次 
执行 时 至 少 删除 一 半 的 0 和 1， 所 以 至 多 1 十 logzn 次 循环 就 可 以 把 全 部 字符 删除 。 于 是 
步骤 2、3 和 4 总 共 消 耗 时 间 (1 十 logzz)O(Cz) ， 即 O(nlogn)。M 的 运行 时 间 是 O(n) + 
O(nlogn) = O(nlogn) 。 

前 面 已 经 证 明 AETIME(zz )， 而 现在 有 更 好 的 界 ， 即 AC TIME (nlogn)。 这 个 结果 
在 单 带 图 灵机 上 不 可 能 进一步 改进 。 实 际 上 ， 单 带 图 灵机 在 o(nlogn) 时 间 内 判定 的 语言 
都 是 正则 语言 ， 问 题 7. 20 要 求证 明 这 一 点 。 

如 果 图 灵机 有 第 二 条 带子 ， 就 可 以 在 O(n) 时 间 (也 称 为 线性 时 间 (liner time)) 内 
判定 语言 A。 下 面 的 双 带 图 灵机 Ms 在 线性 时 间 内 判定 A。 机 器 Ms 的 运行 方式 和 上 面 那 
些 判 定 A 的 机 器 不 同 ， 它 只 是 简单 地 将 所 有 0 复制 到 第 二 条 带子 上 ， 然 后 拿 来 和 1 进行 
匹配 。 

Ms 二 “对 输入 串 w: 

1. 扫描 带子 1， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 
2. 扫描 带子 1 上 的 0， 直 到 第 一 个 1 时 停止 ， 同 时 把 0 复制 到 带子 2 上 。 
3. 扫描 带子 1 上 的 1 直到 输入 的 末尾 。 每 次 从 带子 1 上 读 到 一 个 1， 就 在 带子 2 
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上 删除 一 个 0， 如 果 在 读 完 1 之 前 所 有 的 0 都 被 删除 ， 就 拒绝 。 
4. 如 果 所 有 的 0 都 被 删除 ， 就 接受 。 如 果 还 有 0 剩 下 ， 就 拒绝 。” 

这 个 机 如 分 析 起 来 很 简单 。 四 个 步骤 的 每 一 步 明 显 地 需要 O(n) 步 ， 所 以 全 部 运行 时 
BÆ O(n)， 因 而 是 线性 的 。 注 意 ， 这 是 可 能 的 最 好 运行 时 间 ， 因 为 光 是 读 输入 就 需要 
n 步 。 

总 结 一 下 关于 A 的 时 间 复 杂 度 的 结果 ， 即 判定 A 所 需要 的 时 间 。 给 出 一 个 单 带 图 灵 
机 Mi ， 能 够 在 时 间 O(n?) 内 判定 A， 而 一 个 更 快 的 单 带 图 灵机 M;， 能 够 在 时 间 
O(nlogn) 内 判定 A。 问 题 7. 20 的 证 明 将 指出 ， 不 存在 更 快 的 单 带 图 灵机 。 随 后 将 给 出 一 
个 双 带 图 灵机 Ms ， 能 够 在 时 间 O(n) 内 判定 A。 因 此 A 在 单 带 图 灵机 上 的 时 间 复 杂 度 是 
O(nlogn)， 在 双 融 图 灵机 上 是 O(n)。 注 意 ，A 的 复杂 度 与 选择 的 计算 模型 有 关 。 

上 面 的 讨论 突出 了 复杂 性 理论 与 可 计算 性 理论 之 间 的 一 个 重大 区 别 。 在 可 计算 性 理论 
中 ， 丘 奇 -图 灵 论 题 断 言 ， 所 有 合理 的 计算 模型 都 是 等 价 的 ， 即 它们 所 判定 的 语言 类 都 是 
相同 的 。 在 复杂 性 理论 中 ， 模 型 的 选择 影响 语言 的 时 间 复 杂 度 ， 如 在 一 个 模型 上 线性 时 间 
内 可 判定 的 语言 在 另 一 个 模型 上 就 不 一 定 是 线性 时 间 内 可 判定 的 。 

在 复杂 性 理论 中 ， 根 据 计 算 问 题 的 时 间 复 杂 度 来 对 问题 分 类 。 但 是 用 哪 种 模型 来 度量 
时 间 呢 ? 同一 个 语言 在 不 同 的 模型 上 可 能 需要 不 同 的 时 间 。 

音 运 的 是 ， 对 于 典型 的 确定 型 模型 ， 时 间 需 求 的 差别 不 是 太 大 。 所 以 ， 只 要 分 类 体系 
对 复杂 性 上 相对 较 小 的 差异 不 是 很 敏感 ， 那 么 对 确定 型 模型 的 选择 就 关系 不 大 。 在 下 面 几 
节 中 ， 将 进一步 讨论 这 一 想法 。 


7.1.3 模型 间 的 复杂 性 关系 


现在 考察 计算 模型 的 选择 怎样 影响 语言 的 时 间 复 杂 度 。 考 察 三 种 模型 : 单 带 图 灵机 、 
多 带 图 灵机 和 非 确 定型 图 灵机 。 

itn) 是 一 个 函数 ，i(n) 宇 n。 则 每 一 个 il(n) 时 间 的 多 带 图 灵机 都 和 某 
一 个 OC? (n)) 时 间 的 单 带 图 灵机 等 价 。 

证 明 思 路 ”此 和 定理 的 证 明 思想 非常 简单 。 回 忆 一 下 ， 定 理 3. 8 说 明了 怎样 把 一 个 多 
市 图 灵机 转变 为 一 个 模拟 它 的 单 带 图 灵机 。 分 析 这 种 模拟 ， 确 定 它 需 要 多 少 额 外 的 时 
间 。 证 明 模 拟 多 带 机 的 每 一 步 最 多 需要 单 带 机 的 O(t(n)) 步 。 因 此 总 共 需 要 时 间 为 
OC? (n)) . 

证 明 设 M 是 一 个 在 时 间 t(n) 内 运行 的 & 带 图 灵机 。 构 造 一 个 在 时 间 O (n)) 内 
运行 的 单 带 图 灵机 S. 

Dias S 模拟 MM 运行 ， 正 如 定理 3.8 所 描述 的 那样 。 回 忆 一 下 ，S 用 它 的 一 条 带子 表示 
M 的 所 有 条 带子 的 内 容 。 这 些 带 子 连续 存放 ，M 的 读 写 头 的 位 置 都 标 在 恰当 的 方 格 上 。 

开始 时 ，S 让 它 的 带子 形成 表示 M 的 所 有 带子 的 格式 ， 然 后 模拟 M 的 步 又。 为 了 模拟 
M 的 一 步 ，S 扫描 带子 上 的 所 有 信息 ， 确 定 在 M 的 读 写 头 下 的 符号 。 然 后 S 再 次 扫描 带子 ， 
更 新 带子 内 容 和 读 写 头 位 置 。 如 果 M 的 读 写 头 向 右 移 动 到 带子 上 以 前 没有 读 到 的 位 置 ， 那 么 
S 必须 增加 分 配给 这 条 带子 的 存储 空间 。 为 此 ， 它 把 自己 的 带子 的 一 部 分 向 右 移动 一 格 。 

现在 来 分 析 这 种 模拟 。 对 于 M 的 每 一 步 ， 机 器 S 两 次 扫描 带子 上 活跃 的 部 分 。 第 一 
次 获取 决定 下 一 步 动 作 所 必需 的 信息 ; 第 二 次 完成 这 一 步 的 动作 ，S 的 带子 上 活跃 部 分 的 
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长 度 决定 了 S 扫描 一 次 需要 多 长 时 间 ， 所 以 必须 确定 这 个 长 度 的 上 界 。 为 此 取 M 的 & 条 
带子 上 活跃 部 分 的 长 度 之 和 。 因 为 在 t(n) 步 中 ， 如 果 M 的 读 写 头 在 每 一 步 都 向 右 移动 ， 
M M 用 掉 t(n) 个 带子 方 格 。 若 它 还 向 左 移 ， 则 不 用 那么 多 ， 所 以 每 一 个 活跃 部 分 的 长 度 
最 多 是 i:(n)。 于 是 S 扫描 一 次 它 的 活路 部 分 需要 Ol(t(n)) 步 。 

模拟 M 的 每 一 步 ，S 执行 两 次 扫描 ， 还 可 能 最 多 向 右 移动 上 次 。 每 一 次 用 时 
Olt(n))， 所 以 ， 模拟 M 的 一 步 操 作 ，S 总 共 耗 时 O(i(n))。 

现在 来 界定 模拟 所 需要 的 全 部 时 间 。 在 开始 阶段 ，S 让 它 的 带子 形成 恰当 的 格 
式 ， 这 需要 O(n) 步 。 随 后 ，S 模拟 M 的 tin) 步 操作 ， 每 模拟 一 步 需 要 O(t(n)) 
步 ， 所 以 模拟 部 分 需要 ti(n) XOC(n)) =OC# (n)) 步 。 因 此 ， 整 个 M 的 模拟 过 程 需要 
O(n) +O? (n)) 步 。 

假定 (Sn (这 是 合理 的 假定 ， 因 为 如 果 时 间 更 少 ，M 连 输入 都 读 不 完 )， 则 S 的 
运行 时 间 是 O(f? (n))， 证 毕 。 = 

下 面 考察 对 非 确 定型 单 带 图 灵机 的 类 似 定理 。 证 明 这 种 机 器 所 判定 的 语言 在 确定 型 单 
带 图 灵机 上 也 是 可 判定 的 ， 但 需要 更 多 的 时 间 。 在 此 之 前 ， 必 须 定 义 非 确定 型 图 灵机 的 运 
行 时 间 。 回 忆 一 下 ， 一 个 非 确 定型 图 灵机 当 它 的 所 有 计算 分 支 在 所 有 输入 上 都 停机 时 ， 成 
为 一 个 判定 机 。 

设 N 是 一 个 非 确定 型 图 灵机 ， 并 且 是 个 判定 机 。N 的 运行 时 间 (running 
time) 是 函数 f:N>N, HY fn) 是 在 任何 长 度 为 nn 的 输入 上 所 有 计算 分 支 中 的 最 大 步 
数 ， 如 图 7- 1 所 示 。 


à 确定 型 非 确定 型 
” Lee 


| P jit n 


图 7-1 测量 确定 型 和 非 确 定型 时 间 


非 确定 型 图 灵机 运行 时 间 的 定义 不 是 用 来 对 应 任何 实际 的 计算 设备 的 。 相 反 ， 稍 后 将 
说 明 ， 它 是 一 个 有 用 的 数学 定义 ， 有 助 于 刻画 一 类 重要 的 计算 问题 的 复杂 性 。 

Rtn) 是 一 个 函数 ，t(n) 宇 n。 则 每 一 个 tl(n) 时 间 的 非 确 定型 单 带 图 
灵机 都 与 菜 一 个 204(w) 时 间 的 确定 型 单 带 图 灵机 等 价 。 

证 明 设 入 是 一 个 在 时 间 t(n) 内 运行 的 非 确 定型 图 灵机 ， 同 定理 3. 10 的 证 明 一 样 ， 
构造 确定 型 图 灵机 D，D 通过 搜索 NN 的 非 确定 型 计算 树 来 模拟 N 。 现 在 分 析 这 种 模拟 。 

在 长 度 为 n 的 输入 上 ，NN 的 非 确 定型 计算 树 的 每 一 个 分 支 的 长 度 最 多 是 t+(n)， 树 的 每 
一 个 结 点 最 多 有 48 个 子女 ， 其 中 0 是 N 的 转移 函数 所 决定 的 合法 选择 的 最 大 值 。 因 此 树叶 
的 总 数 最 多 是 b*”，。 

模拟 过 程 以 宽度 优先 法 探查 这 棵 树 。 换 言 之 ， 在 访问 深度 为 d 十 1 的 结 点 之 前 ， 
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先 访问 所 有 深度 为 a 的 结 点 。 定 理 3. 10 的 证 明 中 给 出 的 算法 当 访 问 某 个 结 点 时 ， 就 
从 根 出 发 下 行 到 那个 结 点 。 这 种 做 法 效率 很 低 ， 但 即使 改进 这 种 低 效 率 也 不 会 使 当前 
定理 发 生 改 变 ， 所 以 不 用 改进 它 。 树 中 结 点 的 总 数 小 于 最 大 叶 数 的 两 倍 ， 因 此 用 
OO”) 作为 它 的 上 界 。 从 根 出 发 下 行 到 一 个 结 点 的 时 间 是 O(i(n))。 因 此 ，D 的 运 
行 时 间 是 OC t(n) b ) = 20(t(n)) : 

正如 定理 3. 10 中 所 描述 的 ， 图 灵机 D 有 三 条 带子 。 按 照 定 理 7.8， 把 它 转 变 为 单 带 
图 灵机 最 多 使 运行 时 间 乘 方 。 这 样 ， 单 带 模 拟 机 的 运行 时 间 是 (2% 六 二 2 于 
200K) ， 定 理 得 证 。 m 


7.2 P% 


定理 7. 8 和 定理 7. 10 显示 出 一 个 重要 的 差别 。 一 方面 ， 问 题 的 时 间 复 杂 度 在 确定 型 
单 带 和 多 带 图 灵机 上 最 多 是 平方 或 多 项 式 的 差异 ; 另 一 方面 ， 在 确定 型 和 非 确定 型 图 灵机 
上 ， 问 题 的 时 间 复 杂 度 最 多 是 指数 的 差异 。 


7.2.1 多 项 式 时 间 


运行 时 间 的 多 项 式 差 异 可 以 认为 是 较 小 的 ， 而 指数 差异 则 被 认为 是 大 的 。 看 一 下 为 什 
么 要 选择 区 分 多 项 式 和 指数 ， 而 不 是 选择 别 的 某 两 类 函数 。 

首先 ， 注 意 到 典型 的 多 项 式 nd) 与 典型 的 指数 〈 如 2) 在 增长 率 上 存在 巨大 的 
差异 。 例 如 , 令 nn 是 1000， 这 是 一 个 算法 输入 的 合理 规模 。 在 这 种 情况 下 ， n 是 10 亿 ， 
虽然 是 大 数 ， 但 还 可 以 处 理 。 然 而 ，2” 则 是 一 个 比 宇宙 中 的 原子 数 还 大 得 多 的 数 。 多 项 式 
时 间 算 法 就 很 多 目的 而 言 是 足够 快 了 ， 而 指数 时 间 算 法 则 很 少 使 用 。 

典型 的 指数 时 间 算 法 来 源 于 通过 搜索 解 空间 来 求解 问题 ， 这 称 为 蛮 力 搜索 (brute 
force search)。 例 如 ， 分解 一 个 数 为 素数 因子 的 一 种 方法 是 搜 坑 所 有 可 能 的 因子 。 搜 索 空 
间 的 规模 是 指数 的 ， 所 以 这 种 搜索 需要 指数 时 间 。 有 有 时候， 通过 更 深入 地 理解 问题 ， 可 以 
避免 蛮 力 搜索 ， 从 而 可 能 会 找到 更 实用 的 多 项 式 时 间 算 法 。 

所 有 合理 的 确定 型 计算 模型 都 是 多 项 式 等 价 的 《polynomially equivalent), ， 也 就 是 说 ， 
它们 中 任何 一 个 模型 都 可 以 模拟 另 一 个 ， 而 运行 时 间 只 增长 多 项 式 倍 。 当 称 所 有 合理 的 确 
定型 模型 都 多 项 式 等 价 时 ， 我 们 并 不 是 想 定 义 什么 是 合理 的 。 但 是 在 心里 有 一 个 概念 ， 它 
足够 广泛 ， 能 容纳 那些 和 实际 计算 机 运行 时 间 近 似 的 模型 。 例 如 ， 定 理 7.8 表明 确定 型 单 
带 和 多 带 图 灵机 模型 是 多 项 式 等 价 的 。 

从 现在 起 ， 我 们 关注 时 间 复 杂 性 理论 中 不 受 运行 时 间 仅 有 多 项 式 差 异 影 啊 的 方面 。 忽 
略 这 样 的 差异 让 我 们 可 以 不 依赖 于 选择 具体 计算 模型 来 研究 理论 。 记 住 ， 我 们 的 目标 是 给 
出 计算 的 基本 性 质 ， 而 不 是 图 灵机 或 其 他 特殊 模型 的 性 质 。 

读者 可 能 感到 忽略 运行 时 间 的 多 项 式 差 异 是 荒 雇 的。 实际 上 上， 程序 员 当然 在 乎 这 种 差 
异 ， 而 且 他 们 拼命 干 就 是 为 了 能 让 程序 运行 快 两 倍 。 但 是 ， 前 面 介 绍 渐 近 记 法 的 时 候 ， 忽 
略 了 常数 因子 。 现 在 又 建议 忽略 比 这 大 得 多 的 多 项 式 差 异 ， 如 时 间 n 和 n? 这 样 的 差异 。 

决定 忽略 多 项 式 差 异 并 不 是 说 这 样 的 差异 不 重要 ， 相 反 ， 时 间 n An? 之 间 的 差异 是 
重要 的 。 但 是 某 些 问题 〈 如 因数 分 解 问题 ) 是 多 项 式 的 还 是 非 多 项 式 的 确实 与 多 项 式 差 异 
无 关 ， 而 且 这 些 问题 也 很 重要 。 在 这 里 仅仅 关注 这 种 类 型 的 问题 。 搬 开 树 看 森林 并 不 意味 
着 一 样 比 另 一 样 更 重要 一 一 它 只 是 提供 一 种 不 同 的 视角 。 
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现在 给 出 复杂 性 理论 中 的 一 个 重要 定义 。 
尸 是 确定 型 单 带 图 灵机 在 多 项 式 时 间 内 可 判定 的 语言 类 。 换 言 之 ， 
P=UTIME(n"*) 

在 理论 中 ，P 类 扮演 核心 的 角色 ， 它 的 重要 性 在 于 : 

1. 对 于 所 有 与 确定 型 单 带 图 灵机 多 项 式 等 价 的 计算 模型 来 说 ，P 是 不 变 的 。 

2. P 大 致 对 应 于 在 计算 机 上 实际 可 解 的 那 一 类 问题 。 

第 1 条 表明 ， 在 数学 上 ，P 是 一 个 稳健 的 类 ， 它 不 受 所 采用 的 具体 计算 模型 的 影响 。 

第 2 条 表明 ， 从 实用 的 观点 看 ，P 是 恰当 的 。 当 一 个 问题 在 P 中 的 时 候 ， 就 有 办 法 在 
时 间 n (k 是 常数 ) 内 求解 它 。 至 于 这 么 长 时 间 是 否 实用 就 依赖 于 & 和 实际 的 应 用 情况 。 
当然 ，zao 的 运行 时 间 不 太 可 能 有 任何 实际 应 用 。 不 管 怎样 ， 把 多 项 式 时 间作 为 实际 可 解 
性 的 标准 已 经 被 证 明 是 有 用 的 。 一 旦 为 某 个 原先 似乎 需要 指数 时 间 的 问题 找到 了 多 项 式 时 
间 算法 ， 则 一 定 是 了 解 了 它 的 某 些 关键 的 方面 ， 通 常 就 能 进一步 降低 它 的 复杂 性 ， 达 到 实 
用 的 程度 。 


7.2.2 P 中 的 问题 举例 


当 给 出 多 项 式 时间 算 法 的 时 候 ， 给 出 的 是 算法 的 高 层 描述 ， 没 有 提 及 具体 计算 模型 的 
特点 。 这 样 做 回避 了 带子 和 读 写 头 运动 的 烦琐 细节 。 在 描述 算法 的 时 候 ， 需 遵从 一 定 的 习 
惯 ， 以 便 可 以 分 析 它 的 多 项 式 性 。 

我 们 继续 把 算法 描述 成 带 编号 的 步骤 。 在 图 灵机 上 实现 算法 的 一 个 步骤 通常 需要 图 灵 
机 的 许多 步 。 因 此 ， 我 们 必须 敏感 于 图 灵机 实现 算法 每 一 步 的 步 数 和 算法 的 步骤 总 数 。 

当 分 析 一 个 算法 ， 证明 它 在 多 项 式 时 间 内 运行 时 ， 需 要 做 两 件 事 。 首 先 ， 必 须 为 算法 
在 长 为 n 的 输入 上 运行 时 所 需要 的 步骤 数 给 出 多 项 式 上 界 (一 般 用 大 O 记 法 )。 其 次 ， 必 
须 考察 算法 描述 中 的 每 一 步 ， 保 证 它们 都 可 以 由 合理 的 确定 型 模型 在 多 项 式 时 间 内 实现 。 
在 描述 算法 时 ， 仔 细 确 定 它 的 步骤 ， 以 使 第 二 部 分 分 析 容 易 进 行 。 当 两 部 分 工作 都 完成 以 
后 ， 就 可 以 下 结论 : 算法 在 多 项 式 时 间 内 运行 。 因 为 已 经 证 明 它 需要 多 项 式 个 步骤 ， 所 以 
每 一 步骤 可 以 在 多 项 式 时 间 内 完成 ， 而 多 项 式 的 组 合 还 是 多 项 式 。 

需要 注意 的 是 问题 所 用 的 编码 方法 。 我 们 继续 采用 括号 记 法 “。〉 来 指出 把 一 个 或 多 
个 对 和 象 变 成 字符 串 的 合理 编码 ， 而 不 规定 任何 具体 的 编码 方法 。 现 在 ,合理 的 方法 就 是 允 
许 在 多 项 式 时 间 内 把 对 象 编码 /解码 为 自然 的 内 部 表示 或 其 他 合理 的 编码 。 对 于 图 、 自 动 
机 及 类 似 事 物 的 熟知 的 编码 方法 都 是 合理 的 。 但 请 注意 ， 编 码 数 字 的 一 进 制 记 法 (如 数字 
17 编码 为 一 进 制 字 符 串 11111111111111111) 是 不 合理 的 ， 因 为 它 比 真正 合理 的 编码 (如 
以 任何 & 之 2 为 基 的 记 法 ) 大 指数 倍 。 

本 章 碰 到 的 许多 计算 问题 都 包含 图 的 编码 。 图 的 一 种 合理 编码 是 它 的 结 点 和 边 的 列 
表 ， 另 一 种 是 相 邻 矩阵 (adjacency matrix), EPEA A BAAS AW. WA (i,j) 
项 为 1， 否则 为 0。 当 分 析 图 上 的 算法 时 ， 运 行 时 间 可 能 会 根据 结 点 数 而 不 是 表示 图 的 大 
小 来 计算 。 在 合理 的 图 表示 方法 中 ， 表 示 的 大 小 是 结 点 数 的 多 项 式 。 因 此 ， 如 果 分 析 某 个 
算法 ， 并 证 明 它 的 运行 时 间 是 结 点 数 的 多 项 式 (或 指数 )， 那 么 就 知道 它 是 输入 长 度 的 多 
项 式 (或 指数 ) 了 。 

第 一 个 问题 与 有 向 图 有 关 。 有 向 图 G 包含 结 点 s 和 t+， 如 图 7-2 所 示 。PATH 问题 就 
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是 要 确定 是 否 存在 从 s 到 + 的 有 向 路 径 。 令 
PATH=((G,s,t)| G 是 具有 从 s Z| t 的 有 向 路 径 的 有 向 图 ) 


图 7-2 PATH 问题 ,存在 从 ;到 + 的 路 径 吗 


PATHEP., 
证 明 思 路 ”通过 给 出 判定 PATH 的 多 项 式 时 间 算 法 来 证 明 该 定理 。 在 描述 算法 之 前 ， 
要 注意 到 该 问题 的 蛮 力 算法 是 不 够 快 的 。 
PATH 的 蛮 力 算法 通过 考察 G 中 所 有 可 能 的 路 径 来 确定 是 否 存 在 从 s 到 上 的 有 向 路 
径 。 一 条 可 能 路 径 就 是 G 中 长 度 最 多 为 m 的 结 点 序列 ，m 是 G PHARM. MRM s 到 
t 存在 有 向 路 径 ， 那 么 就 存在 长 度 不 超过 m 的 有 向 路 径 ， 因 为 路 径 上 不 需要 重复 结 点 。) 
但 是 这 些 可 能 的 路 径 数 是 m™， 这 是 G 中 结 点 数 的 指数 倍 。 因 此 该 蛮 力 算法 消耗 指数 时 间 。 
为 了 获得 PATH 的 多 项 式 时 间 算 法 ， 必 须 设法 避免 蛮 力 搜索 。 一 种 办 法 是 采用 图 搜 
索 方 法 ， 如 宽度 优先 搜索 。 连 续 标 记 G 中 从 s 出 发 ， 长 度 为 1，2，3， 直 到 m 的 有 向 路 径 
可 达 的 所 有 结 点 。 用 多 项 式 可 以 容易 地 界定 该 策略 的 运行 时 间 。 
证 明 PATH 的 一 个 多 项 式 时 间 算 法 M 运行 如 下 : 
M 一 “对 输入 (G,s,t), 是 包含 结 点 s 和 上 的 有 向 图 : 
1. 在 结 点 ;上 做 标记 。 
2. 复 重 下 面 步骤 3， 直到 不 再 有 结 点 被 标记 。 
3. 扫描 G 的 所 有 边 。 如 果 找 到 一 条 边 (a,5b)，a 被 标记 而 6b 没有 被 标记 ， 那 么 标 
4. 若 t 被 标记 ， 则 接受 ; 否则 ， 拒 绝 。” 
分 析 该 算法 ， 证 明 它 在 多 项 式 时 间 内 和 运行。 显然， 步骤 1 和 4 只 执行 一 次 。 步 又 3 最 
多 执行 m 次 ， 因 为 除 最 后 一 次 外 ， 每 一 次 执行 都 要 标记 G 中 的 一 个 未 标记 的 结 点 。 所 以 
用 到 的 总 步骤 数 最 多 是 1 十 1 十 m， 是 G 的 规模 的 多 项 式 。 
M 的 步骤 1 和 4 很 容易 用 任何 合理 的 确定 型 模型 在 多 项 式 时 间 内 实现 。 步 又 3 需要 扫 
描 输 入 ， 检 查 某 些 结 点 是 否 被 标记 ， 这 也 容易 在 多 项 式 时 间 内 实现 。 所 以 M Æ PATH 的 
多 项 式 时 间 算 法 。 = 
看 另 一 个 多 项 式 时 间 算 法 的 例子 。 称 两 个 数 是 互 素 的 〈relatively prime), 4 1 是 能 同 
时 整除 它们 的 最 大 整数 。 例 如 ，10 和 21 是 互 素 的 ， 虽 然 它 们 自己 都 不 是 素数 。 但 是 10 和 
22 不 是 互 素 的 ， 因 为 它们 都 能 被 2 整除 。 令 RELPRIME 代表 检查 两 个 数 是 否 互 素 的 问 
题 ， 即 
RELPRIME= {(z,y)|x § y 2%} 


IENA RELPRIMEEDP. 
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证 明 思 路 解决 该 问题 的 一 种 算法 是 搜 遍 这 两 个 数 的 所 有 可 能 的 公 因 于， 如 果 没 有 发 
现 大 于 1 的 公 因子 ， 就 接受 。 然 而 ， 用 二 进 制 或 其 他 任何 以 & 为 基 的 记 法 RS2) 表示 的 
数字 的 大 小 是 它 表 示 长 度 的 指数 倍 。 因 此 该 蛮 力 算法 需要 搜 凯 指数 多 个 可 能 的 因子 ， 消 耗 
指数 的 运行 时 间 。 
我 们 改 用 一 种 古老 的 数值 过 程 来 求解 该 问题 ， 称 为 欧 几 里 得 算法 (Euclidean algorithm), 
以 此 计算 最 大 公 因 子 。 两 个 自然 数 x Ay 的 最 大 公 因 子 (greatest common divisor) WX ged 
(x,y)， 是 能 同时 整除 x 和 yy 的 最 大 整数 。 例 如 ged(18,24)=6. WA, z 和 y 是 互 素 的 充 
分 必要 条 件 是 gcd(zx,y) 二 1。 在 证 明 中 把 欧 几 里 得 算法 描述 为 算法 E, CIE Až mod, 
x mod y 等 于 用 yy 去 整除 x 所 得 的 余数 。 
WEAR 欧 几 里 得 算法 如 下 : 
EF 二 “对 输入 〈z,y);,， Xx 和 y 是 二 进 制 表 示 的 自然 数 : 
1. 重复 下 面 的 操作 ， 直 到 y= 二 0。 
a 赋值 r-r mod y. 
9. 交换 x Aly 的 值 。 
4. 输出 x.” 
算法 RUIE 为 子 程序 求解 RELPRIME. 
R=“X A (r, y), c My 是 二 进 制 表 示 的 自然 数 ; 
l. Æ 《zy yw) EEE, 
2. BARA], MHS; 否则 ， 就 拒绝 。” 
显然 ， 若 在 多 项 式 时 间 内 运行 且 正 确 ， 则 R 也 在 多 项 式 时 间 内 运行 且 正 确 。 所 以 
Reon E 的 时 间 和 正确 性 。 该 算法 的 正确 性 是 众所周知 的 ， 不 在 这 里 进一步 讨论 它 。 
为 了 分 析 五 的 时 间 复 杂 度 ， 首 先 证 明 步 又 2 的 每 一 次 执行 〈 除 了 第 一 次 有 可 能 例外 ) 
都 把 z 的 值 至 少 减 少 一 半 。 执 行 步骤 2 以 后 ， 由 函数 mod 的 性 质 知 zx 和 >。 步 又 3 后 ， 有 
Zz>>y， 因 为 这 两 个 值 已 经 交换 。 于 是 当 步 又 2 随后 执行 时 有 >y. A2x/2>y, MM x mod 
>y<y 委 z/2，z 至 少 减少 一 半 。 关 Xz/2 二 y， 则 x mod y=x—y<2/2, zt 至 少 减 少 一 半 。 
每 一 次 执行 步骤 3 都 使 z+ 和 yy 的 值 相互 交换 ， 所 以 每 两 次 循环 就 使 得 x Aly 原先 的 值 
至 少 减少 一 半 。 于 是 步骤 2 和 3 执行 的 最 大 次 数 是 Zlogox 和 2logzy 中 较 小 的 那 一 个 。 这 
两 个 对 数 与 表示 的 长 度 成 正比 ， 步 又 的 执行 次 数 是 On). E 的 每 一 步 仅 消耗 多 项 式 时 间 ， 
所 以 整个 运行 时 间 是 多 项 式 的 。 Bt 
最 后 一 个 多 项 式 时 间 算 法 的 例子 表明 ， 每 一 个 上 下 文 无 关 语言 是 多 项 式 时 间 可 判定 的 。 
每 一 个 上 下 文 无 关 语言 都 是 也 的 成 员 。 
证 明 思 路 ”定理 4.8 证 明了 每 一 个 CFL 都 是 可 判定 的 ， 并 且 为 每 一 个 CFL 给 出 了 判 
定 算法 。 如 果 那 个 算法 在 多 项 式 时 间 内 运行 ， 那 么 本 定理 作为 推论 就 必然 成 立 。 回 忆 一 下 
那个 算法 ， 看 它 运 行 得 是 否 够 快 。 
& L 是 一 个 由 CFG G 产生 的 CFL, G 是 乔 姆 斯 基 范 式 。 由 问题 2. 38 知 : AG 是 乔 姆 
斯 基 范 式 ， 故 任何 得 到 字符 串 w 的 推导 都 有 2n 一 1 步 ,，n 是 ww 的 长 度 。 当 给 工 的 判定 机 
输入 长 为 ”的 字符 串 时 ， 它 通过 试 遍 所 有 可 能 的 2n 一 1 步 推导 来 判定 LL。 如 果 其 中 有 一 个 
得 到 w 的 推导 ， 该 判定 机 就 接受 ; 否则 ， 就 拒绝 。 
分 析 一 下 该 算法 可 知 ， 它 不 能 在 多 项 式 时 间 内 运行 。k 步 推导 的 数量 可 能 达到 的 指 


数 ， 所 以 该 算法 可 能 需要 指数 时 间 。 

为 了 获得 多 项 式 时 间 算 法 ， 在 此 介绍 一 种 强 有 力 的 技术 ， 称 为 动态 规划 Cdynamic 
programming) 。 这 种 技术 通过 累积 小 的 子 问题 的 信息 来 解决 大 的 问题 。 把 子 问 题 的 解 都 记 
录 下 来 ， 这 样 就 只 需 对 它 求解 一 次 。 为 此 ， 把 所 有 子 问题 编 成 一 张 表 ， 当 碰 到 它们 时 ， 把 
它们 的 解 系统 地 填 人 表格 。 

在 本 例 中 ， 考 虑 G 的 每 一 个 变 元 是 否 产 生 w 的 每 一 个 子 串 这 样 的 子 问题 。 算 法 把 子 
问题 的 解 填 和 人 一 张 nXn 表格 。 对 于 iy, RNB Gj) 项 包含 产生 子 串 wiwi+1"…wj 的 
MAZI. >j 的 表 项 没有 使 用 。 

算法 为 w 的 每 一 子 串 填写 表 项 。 首 先 为 长 为 1 的 子 串 填写 表 项 ， 然 后 是 长 为 2 的 子 
串 ， 依 此 类 推 。 它 利用 短 子 串 的 表 项 内 容 来 辅助 确定 长 子 串 的 表 项 内 容 。 

例如 ， 假 定 该 算法 已 经 确定 了 由 哪些 变 元 产生 所 有 长 度 不 超过 有 的 子 串 。 为 了 确定 变 
元 A 是否 产生 某 一 长 为 & 十 1 的 子 串 ， 算 法 把 该 子 串 以 有 种 可 能 方式 分 裂 为 非 空 的 两 段 。 
对 于 每 一 种 分 裂 方 式 ， 算 法 考察 每 一 条 规则 A 一 BC， 利 用 以 前 计算 的 表 项 来 确定 是 否 B 
产生 第 一 段 而 且 C 产生 第 二 段 。 如 果 B 和 C 都 产生 各 自 的 段 ， 那 么 A 就 产生 该 子 串 ， 并 
且 被 加 入 相关 联 的 表 项 。 算 法 从 长 为 1 的 串 开 始 ， 对 规则 A 一 b 考察 表格 。 

证 明 下 面 的 算法 D 实现 了 这 一 证 明 思 路 。 令 G 是 产生 CFL 工 的 乔 姆 斯 基 范 式 的 
CFG, 假设 S 是 起 始 变 元 。( 回 忆 一 下 ， 空 串 在 乔 姆 斯 基 范 式 文法 中 被 特殊 人 处理。 算法 在 
步骤 1 中 处 理 w= 的 特殊 情况 。) 注释 写 在 方 括号 中 。 

万 一 “对 输入 wS w Wr: 

l. Æ w=e H S>: 是 一 条 规则 ， 则 接受 。 否 则 拒绝 。 Lw=e 的 情况 ] 
2. 对 i=1~n: [考察 每 一 长 为 INF HR 
3. 对 每 一 变 元 A， 

1 检查 A 一 b 是 否 是 一 条 规则 ， 其 中 5b 二 wi;。 

Ate, FEA BA table (i,i)。 

6 

7 

8 

9 


对 2=2~n: [ 是 子 串 的 长 度 j 
对 ;一 1 一 7 一 /十 1 Li 是 子 串 的 起 始 位 置 ] 
令 j= 二 i 十 /一 1。 Lj 是 子 串 的 结束 位 置 ] 
Xt k=i~j—1: Lk 是 分 裂 位 置 ] 
10. 对 每 一 条 规则 A> BC; 
Lf, Ë tablei,k) 包含 BH table(k+1,j) 包含 C， 则 把 A BLA table(i,j)。 


12. Æ S fEtable(1,n) 中 ， 则 接受 ; AM, 24%.” 
现在 分 析 刀 。 每 一 步 很 容易 在 多 项 式 时 间 内 运行 。 步 又 4 和 5 最 多 运行 xp 次， 其 中 
是 G 中 的 变 元 数 ， 是 与 无 关 的 固定 常数 ;因此 这 两 步 运行 O(n) KR. HR 最 多 运行 nn 
K.o BRO 每 运行 一 次 ， 步 又 7 最 多 运行 n 次 。 步 骤 7 每 运行 一 次 ， 步 又 8 和 9 最 多 运行 
1 次。 步骤 9 每 运行 一 次 ， 步 骤 10 运行 > 次 ， 这 里 > 是 G 的 规则 数 ， 是 另 一 个 固定 常数 。 
所 以 步骤 11 〈 即 该 算法 的 内 层 循环 ) FOG) wm. Bit DATO) H. x 


7.3 NP 类 


如 7.2 节 所 揭示 的 ， 许 多 问题 可 以 避免 蛮 力 搜索 而 获得 多 项 式 时 间 人 解法。 但 是 ， 在 某 
些 其 他 问题 (包括 许多 有 趣 而 有 用 的 问题 中 ， 避 免 蛮 力 搜 索 的 努力 还 没有 成 功 ， 求 解 它 
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们 的 多 项 式 时 间 算 法 还 没有 找到 。 

为 什么 对 这 些 问 题 寻找 多 项 式 时 间 算 法 还 没有 取得 成 功 呢 ? 我 们 不 知道 这 个 重要 问题 
的 答案 是 什么 。 可 能 这 些 问题 具有 基于 未 知 原理 的 多 项 式 时 间 算 法 ， 但 至 今 还 没有 被 发 
现 ， 或 者 它们 中 的 某 些 问题 就 是 不 能 在 多 项 式 时 间 内 解决 。 它 们 可 能 是 固有 地 难 计算 的 。 

关于 该 问题 的 一 个 不 寻常 的 发 现 是 ， 许 多 问题 的 复杂 性 是 联系 在 一 起 的 。 发 现 其 中 一 
个 问题 的 多 项 式 时 间 算 法 可 以 用 来 解决 整个 一 
类 问题 。 从 一 个 例子 开始 来 理解 这 一 现象 。 

AH K G 中 的 哈密 顿 路 径 〈(Hamiltonian 
path) 是 通过 每 个 结 点 恰好 一 次 的 有 回路 径 。 考 
虑 这 样 一 个 问题 : 验证 一 个 有 向 图 是 否 包含 一 条 
哈密 顿 路 径 连 接着 两 个 指定 的 结 点 ， 如 图 7-3 所 
示 。 令 图 7-3 哈密 顿 路 径 经 过 每 个 结 点 恰好 一 次 

HAMPATH={(G,s,t)|G 是 包含 从 s 到 上 的 哈密 顿 路 径 的 有 向 图 } 

通过 修改 定理 7. 12 给 出 的 PATH 的 蛮 力 算法 ， 很 容易 获得 HAMPATH 问题 的 指数 
时 间 算 法 。 只 需 增 加 一 项 检查 ， 验 证 可 能 的 路 径 是 哈密 顿 路 径 。 没 有 人 知道 HAMPATH 
是 否 能 在 多 项 式 时 间 内 求解 。 

HAMPATH 问题 还 具有 一 个 特点 ， 称 为 多 项 式 可 验证 性 (polynomial verifiability)， 
这 对 于 理解 它 的 复杂 性 很 重要 。 虽 然 还 不 知道 一 种 快速 〈 即 多 项 式 时 间 ) 的 方法 来 确定 图 
中 是 否 包含 哈密 顿 路 径 ， 但 是 如 果 以 某 种 方式 〈 可 能 采用 指数 时 间 算 法 ) 找到 这 样 的 路 
径 ， 就 能 很 容易 让 人 相信 它 的 存在 ， 这 只 需 给 出 它 即 可 。 换 言 之 ， 验 证 哈密 顿 路 径 的 存在 
性 可 能 比 确定 它 的 存在 性 容易 得 多 。 

男 一 个 多 项 式 可 验证 的 问题 是 合 数 性 。 回 忆 一 下 ， 当 一 个 自然 数 是 两 个 大 于 1 的 整数 
的 乘积 时 ， 称 该 自然 数 为 合 数 (composite) 〈 即 合 数 就 是 非 素数 的 数 ) 。 令 

COMPOSITES=({x|z=pq, © p»q>1} 
虽然 不 知道 判定 该 问题 的 多 项 式 时 间 算 法 ， 但 是 能 轻易 地 验证 一 个 数 是 合 数 一 一 只 需要 该 
数 的 一 个 因子 即 可 。 最 近 ， 发 现 了 一 个 可 验证 某 数 是 素数 还 是 合 数 的 多 项 式 时 间 算 法 ， 但 
它 比 前 面 提 到 的 合 数 性 验证 方法 更 复杂 。 

有 些 问题 可 能 不 是 多 项 式 可 验证 的 。 例 如 ，HHAMPATH， 即 HAMPATH 问题 的 补 
问题 。 尽 管 能 够 (以 某 种 方式 ) 判定 图 中 没有 哈密 顿 路 径 ， 但 如 果 不 采 用 原先 做 判定 时 用 
的 那个 指数 时 间 算 法 ， 就 没有 其 他 办 法 让 别人 验证 它 的 不 存在 性 。 下 面 是 形式 化 的 定义 。 

语言 A 的 验证 机 (verifier) 是 一 个 算法 了， 这 里 

A={w| aS FFB c, V 接受 《wc)} 
因为 只 根据 也 的 长 度 来 度量 验证 机 的 时 间 ， 所 以 多 项 式 时 间 验 证 机 (polynomial time vert 
fier) 在 了 世 的 长 度 的 多 项 式 时 间 内 运行 。 若 语言 A 有 一 个 多 项 式 时 间 验 证 机 ， 则 称 它 为 多 
项 式 可 验证 的 (polynomially verifiable), 

验证 机 利用 额外 的 信息 〈 在 定义 7. 15 中 用 符号 c 表示) 来 验证 字符 串 c 是 A 的 成 员 。 
该 信息 称 为 A 的 成 员 资格 证 书 〈certificate) 或 证 明 〈proof) 。 注 意 ， 对 于 多 项 式 验证 机 ， 
证 书 具 有 多 项 式 的 长 度 (w 的 长 度 ) ， 因 为 这 是 该 验证 机 在 它 的 时 间 界 限 内 所 能 访问 的 全 
部 信息 长 度 。 把 该 定义 应 用 到 语言 HAMPATH 和 COMPOSITES 上 。 
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对 于 HAMPATH H, FP (G,s,t) € HAMPATH 的 证 书 就 只 是 一 条 从 s Bt 
的 哈密 顿 路 径 。 对 于 COMPOSITES 问题 ， 合 数 z 的 证 书 只 是 它 的 一 个 因子 。 在 这 两 种 
情况 下 ， 当 把 证 书 交 给 验证 机 以 后 ， 它 就 能 在 多 项 式 时 间 内 检查 输入 是 否 在 语言 
Sie NP 是 具有 多 项 式 时 间 验 证 机 的 语言 类 。 

NP 类 是 重要 的 ， 因 为 它 包含 许多 具有 实际 意义 的 问题 。 从 前 面 的 讨论 可 知 ，HAMPATH 
All COMPOSITES 都 是 NP 的 成 员 。COMPOSITES 也 是 NP 的 子 集 P 的 成 员 ， 但 要 证 明 
这 个 更 强 的 结论 非常 困难 。 术 语 NP 即 非 确 定型 多 项 式 时 间 (nondeterministic polynomial 
time)， 来 源 于 使 用 非 确定 型 多 项 式 时 间 图 灵机 的 男 一 特征 。 在 NP 中 的 问题 有 时 被 称 为 
NP 问题 。 

下 面 是 一 个 在 非 确 定型 多 项 式 时 间 内 判定 HAMPATH 问题 的 非 确 定型 图 灵机 
(NTM)。 回 忆 一 下 ， 在 定义 7.9 中 ， 定义 非 确定 型 机 器 的 时 间 为 最 长 计算 分 支 所 用 的 
时 间 。 

Ni 二 “对 输入 〈(G,s,t);， 这 里 G 是 包含 结 点 s Mt 的 有 向 图 : 

1. 写 一列 m 个 数 p1,pz，,…,pm，m ÆG 的 结 点 数 。 列 中 每 一 个 数 都 是 从 1 到 mm 
中 非 确定 地 挑选 。 

2. 在 列 中 检查 重复 性 ， 知 发 现 有 重复 ， 则 拒绝 。 

3. 检查 * 王 加 和 二 加 是 否 都 成 立 。 若 有 一 个 不 成 立 ， 则 拒绝 。 

4. 对 于 1 到 m 一 1 中 的 每 一 个 i, 检查 (bipi) 是 否 是 G 的 一 条 边 。 若 有 一 
个 不 是 ， 则 拒绝 。 否 则 ， 所 有 检查 都 通过 了 ， 接 受 。” 

为 了 分 析 该 算法 并 且 验 证 它 在 非 确定 型 多 项 式 时 间 内 运行 ， 考 察 它 的 每 一 步 又。 在 步 
又 1 中 ， 非 确定 的 选择 显然 在 多 项 式 时 间 内 运行 。 在 步骤 2 和 3 中， 每 一 步 是 一 次 简单 的 
检查 ， 所 以 合 起 来 它们 仍 在 多 项 式 时 间 内 和 运行。 最后， 步骤 4 显然 也 在 多 项 式 时 间 内 运 
行 。 于 是 ， 该 算法 在 非 确 定型 多 项 式 时 间 内 运行 。 

一 个 语言 在 NP 中 ， 当 且 仅 当 它 能 被 某 个 非 确 定型 多 项 式 时 间 图 灵机 判定 。 

证 明 思 路 ”我们 证 明 怎 样 把 一 个 多 项 式 时 间 验 证 机 转化 为 等 价 的 多 项 式 时 间 NTM 以 
及 怎样 反 回 转化 。NTM 通过 猜想 证 书 来 模拟 验证 机 ， 验 证 机 通过 把 接受 分 支 作为 证 书 来 
模拟 NTM. 

证 明 对 于 该 定理 从 左 向 右 的 方向 ， 设 AE NP， 要 证 A 被 多 项 式 时 间 NTM N 判定 。 
由 NP 的 定义 ， 存 在 A 的 多 项 式 时 间 验 证 机 V。 假 设 V 是 一 个 在 时 间 n* 内 运行 的 图 灵机 ， 
构造 N 如 下 : 

N 二 “对 长 为 n WRA w: 

1. 非 确定 地 选择 最 长 为 n* 的 字符 串 c。 
2. 在 输入 (lw, ET V. 
3. AV 接受 ， 则 接受 ; 否则 拒绝 。” 

为 了 证 明 该 定理 的 男 一 个 方向 ， 假 设 A 被 多 项 式 时 间 NIM N 判定 ， 构 造 多 项 式 时 间 
验证 机 VV 如下: 

V = 二 “对 输入 lwc), XE w, c 是 字符 串 : 

1. 在 输入 w 上 模拟 N， 把 c 的 每 一 个 符号 看 作 是 对 每 一 步 所 做 的 非 确定 性 选择 
的 描述 (正如 在 定理 3. 10 的 证 明 中 那样 ) 。 
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2 Æ 六 的 当前 计算 分 支 接受 ， 则 接受 ; 否则 拒绝 。” a 
类 似 于 确定 型 时 间 复 杂 性 类 TIME(z(n))， 定 义 非 确定 型 时 间 复 杂 性 类 NTIME(z(z) ) 。 
NTIME(iCz)) 王 全 | 二 是 一 个 被 O(CtCa)) 时 间 的 非 确 定型 图 灵机 判定 的 


NP= UNTIME(n:). 

NP 类 对 于 合理 的 非 确 定型 计算 模型 的 选择 不 敏感 ， 因 为 所 有 这 些 模型 都 是 多 项 式 等 
价 的 。 在 描述 和 分 析 非 确定 型 多 项 式 时 间 算 法 时 ， 遵 循 前 面 的 确定 型 多 项 式 时 间 算 法 的 习 
惯 。 非 确定 型 多 项 式 时 间 算 法 的 每 一 步 必 须 在 合理 的 非 确 定型 计算 模型 上 ， 在 非 确 定 的 多 
项 式 时 间 内 应 该 可 以 明显 地 实现 。 分 析 算 法 以 证 明 每 一 分 支 最 多 使 用 多 项 式 个 步骤 。 


7.3.1 NP 中 的 问题 举例 
无 向 图 中 的 一 个 团 (clique) 是 一 个 子 图 ， 其 中 每 两 个 结 点 都 有 边 相 连 。 上 上 Ck 


clique) 就 是 包含 A 个 结 点 的 团 。 图 7- 4 展示 一 个 包含 5 团 人 ~ S a 
EES 
K os 


的 图 。 
团 问 题 旨 在 判定 一 个 图 是 否 包 含 指定 大 小 的 团 。 令 
图 7-4 包含 5 团 的 图 


CLIQUE={(G,k)|G 是 包含 & 团 的 无 向 图 } 
CLIQUE & + NP. 
证 明 思 路 团 即 是 证 书 。 
证 明 ”下面 是 CLIQUE 的 验证 机 V。 
V 一 “对 输入 〈(G,R，c): 
1. 检查 c 是 否 是 G 中 有 & THAWTE. 
2. 检查 G 是 否 包 含 连接 < 中 结 点 的 所 有 边 。 
3. 若 两 项 检查 都 通过 ， 则 接受 ; 否则 ， 拒 绝 。” 
另 一 种 证 明 如 果 读 者 喜欢 从 非 确定 型 多 项 式 时 间 图 灵机 的 角度 来 理解 NP 类 ， 那 么 
可 以 通过 给 出 判定 CLIQUE 的 图 灵机 来 证 明 本 定理。 注意 这 两 种 证 明 的 相似 性 。 
N= 二“ 对 输入 (G.k), XE G 是 一 个 图 : 
1. 非 确定 地 选择 G HR 个 结 点 的 子 集 c。 
2. 检查 G 是 否 包 含 连接 < 中 结 点 的 所 有 边 。 
3. 若是 ， 则 接受 ; 否则 拒绝 。” a 
下 面 考虑 与 整数 算术 有 关 的 问题 SUBSETSUM。 给 定 一 个 数 集 zx1,… ,zs 和 一 个 目 
标 数 上 ， 要 判定 在 这 个 集合 中 是 否 有 一 个 加 起 来 等 于 上 的 子 集 。 即 
SUBSET-SUM = {(s,t)|s 一 (zl ssr}, HFE 
(yi reap} Elri eri E ymt} 
Mim, <{4,11,16,21,27},25) E€ SUBSET-SUM, WX 4+21=25, ER {zx1,…,xi) 和 
{y1，"… ,yi) 被 看 作 是 多 重 集 (multiset) ， 因 此 人 允许 元 素 重 复 。 
SUBSET-SUM 属于 NP. 
证 明 思 路 ” 子 集 就 是 证 书 。 
证 明 下 面 是 SUBSET-SUM 的 一 个 验证 机 VV。 
V=“ 对 输入 〈(S,t) ,ce): 





1. 检查 c 是 否 是 加 起 来 等 于 t 的 数 的 集合 。 
2. 检查 S 是 否 包 含 c 中 的 所 有 数 。 
3. 知 两 项 检查 都 通过 ， 则 接受 ; 否则 拒绝 。” 
另 一 种 证 明 还 可 以 通过 给 出 判定 SUBSET-SUM 的 非 确 定型 多 项 式 时 间 图 灵机 来 证 
明 本 和 定理， 如 下 所 示 : 
N=“xtH A (S,t): 
1. 非 确定 地 选择 S 中 的 数 的 一 个 子 集合 c。 
2. 检查 c 是 否 是 加 起 来 等 于 t 的 数 的 集合 。 
3. 在 检查 通过 ， 则 接受 ; 否则 拒绝 。” a 
注意 这 些 集合 的 补 集 (CLIQUE 和 SUBSET-SUM) 不 是 很 明显 地 属于 NP。 验 证 某 种 
事物 不 存在 好 像 要 比 验 证 它 存在 更 加 困难 。 我 们 和 定义 另外 一 个 复杂 性 类 ， 称 为 coNP， 它 
包括 NP 中 的 语言 的 补 语言 。 还 不 知道 coNP EAS NP AR. 





7.3.2 P 与 NP 问题 


如 前 所 述 ，NP 是 在 非 确 定型 图 灵机 上 多 项 式 时 间 内 可 解 的 语言 类 ， 或 者 等 价 地 说 ， 
是 成 员 资 格 可 以 在 多 项 式 时 间 内 验证 的 语言 类 。P 是 成 员 资 格 可 以 在 多 项 式 时 间 内 判定 的 
语言 类 。 把 这 些 内 容 总 结 如 下 ， 其 中 ， 把 多 项 式 时 间 可 解 的 粗略 地 称 为 “快速 地 ”可 
- 解 的 。 

P 王 成 员 资格 可 以 快速 地 判定 的 语言 类 。 

NP 二 成 员 资 格 可 以 快速 地 验证 的 语言 类 。 

前 面 已 经 给 出 了 语言 的 例子 ， 如 HAMPATH 和 CLIQUE， 它 们 是 NPM, (AA 
知道 是 否 属于 P。 多 项 式 可 验证 性 的 能 力 似 乎 比 多 项 式 可 判定 性 的 能 力 大 得 多 。 但 难以 想 
象 的 是 ，P 和 NP 也 有 可 能 是 相等 的 。 现 在 还 无 法 证 明 在 NP 中 存在 一 个 不 属于 了 的 语言 。 

P=NP 是 否 成 立 的 问题 是 理论 计算 机 科学 和 当代 数学 中 最 大 的 悬而未决 的 问题 之 一 。 
如 果 这 两 个 类 相等 ， 那 么 所 有 多 项 式 可 验证 的 问题 都 将 是 多 项 式 可 判定 的 。 大 多 数 研 究 者 
相信 这 两 个 类 是 不 相等 的 ， 因 为 人 们 已 经 投入 了 大 量 
的 精力 为 NP 中 的 某 些 问题 寻找 多 项 式 时 间 算 法 ， 但 
没 人 取得 成 功 。 研 究 者 还 试图 证 明 这 两 个 类 是 不 相等 
的 ， 但 是 这 要 求证 明 不 存在 快速 算法 来 代替 蛮 力 搜索 。 
目前 科学 研究 还 无 法 做 到 这 一 步 。 图 7-5 显示 了 两 种 G 
可 能 性 。 

已 知 最 好 的 判定 语言 是 NP 的 确定 型 方法 使 用 指 
数 时 间 。 换 言 之 ， 可 以 证 明 图 7-5 这 两 个 可 能 中 有 一 个 是 正确 的 

NPGEXPTIME= Ų TIME(2” ) 


但 是 ， 不 知道 NP 是 否 包 含 在 某 个 更 小 的 确定 型 时 间 复 杂 性 类 中 。 


7.4 ”NP 完全 性 


在 P 与 NP 问题 上 的 一 个 重大 进展 是 在 20 世纪 70 年 代 初 由 斯 蒂 芬 。 库 克 (Stephen 
Cook) 和 列 奥 尼 德 。 列 文 (Leonid Levin) 完成 的 。 他 们 发 现 NP 中 某 些 问 题 的 复杂 性 与 
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整个 类 的 复杂 性 相关 联 。 这 些 问题 中 任何 一 个 如 果 存 在 多 项 式 时 间 算 法 ， AAPA NP 问 
题 都 是 多 项 式 时 间 可 解 的 。 这 些 问题 称 为 NP 完全 的 (NP-complete), NP 完全 性 现象 对 
于 理论 与 实践 都 具有 重要 意义 。 

在 理论 方面 ， 试 图 证 明 P 不 等 于 NP 的 研究 者 可 以 把 注意 力 集中 到 一 个 NP 完全 问题 
E. WR NP 中 的 某 个 问题 需要 多 于 多 项 式 时 间 ， 和 那么 NP 完全 问题 也 一 定 如 此 。 而 且 ， 
试图 证 明 P 等 于 NP 的 研究 者 只 需 为 一 个 NP 完全 问题 找到 多 项 式 时 间 算 法 就 可 以 达到 目 
的 了 。 

在 实践 方面 ，NP 完全 性 现象 可 以 防止 为 某 一 具体 问题 浪费 时 间 去 寻找 本 不 存在 的 多 
项 式 时 间 算 法 。 虽 然 ， 可 能 缺乏 足够 的 数学 依据 来 证 明 该 问题 在 多 项 式 时 间 内 不 可 解 ， 但 
是 我 们 相信 PP 不 等 于 NP， 所 以 ,证明 一 个 问题 是 NP 完全 的 就 成 为 它 的 非 多 项 式 性 的 一 
个 强 有 力 的 证 据 。 

给 出 的 第 一 个 NP 完全 问题 称 为 可 满足 性 问题 (satisfiability problem)。 回 忆 一 下 ， 
取 值 为 TRUE 和 FALSE 的 变量 称 为 布尔 变量 (Boolean variable) ( 见 0.2 节 )。 通 常用 1 
表示 TRUE， 用 0 表示 FALSE, 布尔 运算 (Boolean operation) AND, OR, NOT 分 别 
表示 为 人 A，V ， 一 。 这 些 运 算 在 下 表 中 描述 。 用 上 横 线 作为 一 符号 的 缩写 ， 所 以 THRE 
i T 


0A0=0 0V0=0 p= 
0A1=0 OV1=1 1=0 
1A0=0 1V0=1 
| TW Ts 


布尔 公式 (Boolean formula) 是 包含 布尔 变量 和 运算 的 表达 式 。 例 如 ， 
s= (ThAyY (A 
是 一 个 布尔 公式 。 如 果 对 变量 的 某 个 0，1 赋值 使 得 一 个 公式 的 值 等 于 1， 则 该 布尔 公式 是 
可 满足 的 〈satisfiable) 。 上 面 的 公式 是 可 满足 的 ， 因 为 赋值 zx 王 0，y 王 1，z 一 0 使 得 $ W 
值 为 1。 称 该 赋值 满足 #4。 可 满足 性 问题 (satisfiability problem) 就 是 判定 一 个 布尔 公式 
是 否 是 可 满足 的 。 令 
SAT=((6)|¢ 是 可 满足 的 布尔 公式 )} 

现在 表述 一 个 把 SAT 问题 的 复杂 性 与 NP 中 所 有 问题 的 复杂 性 联系 起 来 的 定理 。 

SATEP， 当 有 上 且 仅 当 P=NP, 

下 面 叙 述 该 定理 证 明 的 核心 方法 。 


7.4.1 多 项 式 时 间 可 归 约 性 


在 第 5 章 中 ， 定 义 了 把 一 个 问题 归 约 到 另 一 个 问题 的 概念 。 当 问题 A 归 约 到 问题 B 
时 ，B 的 解 就 可 以 用 来 求解 A。 现在 定义 一 种 关于 计算 效率 的 可 归 约 性 。 当 问题 A 有 效 地 
归 约 到 问题 B 时 ，B 的 有 效 解 就 可 以 用 来 有 效 地 求解 A。 

若 存 在 多 项 式 时 间 图 灵机 M， 使 得 在 任何 输入 w 上 ，IM 停机 时 fw) 
恰好 在 带子 上 ， 则 称 函 数 f:5* 一 35* 为 多 项 式 时 间 可 计算 函数 (polynomial time computa- 


ble function) , 
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语言 A 称 为 多 项 式 时 间 映 射 可 归 约 2 (polynomial time mapping reduci- 
ble) 到 语言 B,， 或 简称 为 多 项 式 时 间 可 归 约 (polynomial time reducible) 到 召 ， 记 为 
A<pB， 若 存在 多 项 式 时 间 可 计算 函数 f: 一 5* ， 对 于 每 一 个 ww， 有 

weASf(w)E€B 
He f 称 为 A 到 B 的 多 项 式 时 间 归 约 (polynomial time reduction) 。 

多 项 式 时 间 可 归 约 性 是 5. 3 节 定 义 的 映射 可 归 约 
性 的 有 效 近 似 。 还 有 其 他 形式 的 有 效 可 归 约 性 ， 但 是 
多 项 式 时 间 可 归 约 性 是 一 种 简单 形式 ， 而 且 就 我 们 的 
目的 而 言 也 已 足够 ， 所 以 不 在 这 里 讨论 其 他 形式 。 
图 7-6 展示 的 是 多 项 式 时 间 可 归 约 性 。 

如 同一 般 的 映射 归 约 一 样 ，A 到 B 的 多 项 式 时 间 
归 约 提供 了 一 种 方法 ， 把 A 的 成 员 资 格 判 定 转 化 为 B 
的 成 员 资 格 判 定 ， 只 是 现在 这 种 转化 是 有 效 地 完成 
的 。 为 了 判定 是 否 wE A， 用 归 约 ff 把 w 映射 为 
fl(w)， 然 后 判定 是 否 f(w CB, 

如 果 一 个 语言 能 多 项 式 时 间 可 归 约 到 男 一 个 已 知 有 和 多项式 时 间 算 法 的 语言 ， 就 可 以 获 
得 第 一 个 语言 的 多 项 式 时 间 算 法 ， 如 下 面 的 定理 所 述 。 

#A<,BHBEP, M AEP, 

证 明 设 M 是 判定 B 的 多 项 式 时间 算 法 ，f 是 从 A 到 B 的 多 项 式 时 间 归 约 。 判 定 A 
的 多 项 式 时 间 算 法 N 的 描述 如 下 : 

N= 二 “对 输入 w: 

l- 计算 flws 
2. 在 输入 fw) 上 运行 M， 输 出 M 的 输出 。” 

AwEeA, i fl(w)EB， 因 为 是 从 A 到 B 的 归 约 。 于 是 ， 只 要 wEA，M 就 接受 
fw). AJh, RAK N 的 两 个 步骤 都 在 多 项 式 时 间 内 运行 ， 所 以 NN 在 多 项 式 时 间 内 运行 。 
注意 ， 步 骤 2 在 多 项 式 时 间 内 运行 是 因为 两 个 多 项 式 的 合成 还 是 多 项 式 。 a 

在 进一步 说 明 多 项 式 时 间 归 约 之 前 ， 先 介绍 3SAT， 它 是 可 满足 性 问题 的 一 种 特殊 情 
况 ， 因 为 其 中 所 有 公式 都 具有 一 种 特殊 形式 。 文 字 (literal) 是 一 个 布尔 变量 或 布尔 变量 
NSE, Wao Mz, FR) (clause) 是 由 V 连接 起 来 的 在 干 文字 ， 如 C VaV z Vz), — 
个 布尔 公式 阁 是 由 人 连接 的 寿 干 子 句 组 成 ， 则 为 合 取 范式 (conjunctive normal form) W, 
PENA cnf 公式 ， 如 

Ca, V me V Ze V aad A Gee Ya V aed A Cay V Ep) 
AMA SARA =P MF, WA 3cnf 公式 an 
Cor V ae V as) A Ges V oe V oe? A Ges V ze V xed A Coa V oe V oe) 
& 3SAT={(¢6)|¢ 是 可 满足 的 3cnf 公式 }。 如 果 一 个 赋值 满足 一 个 cnf 公式 ， 那 么 每 一 个 
子 句 必须 至 少 包 含 一 个 值 为 1 的 文字 。 
下 面 的 定理 给 出 从 3SAT 问题 到 CLIQUE 问题 的 多 项 式 时 间 归 约 。 





图 7-6 从 A 到 B 的 多 项 式 
时 间 归 约 函 数 f 


牟 “ 某 些 其 他 教科 书 称 它 为 多 项 式 时 间 多 一 可 归 约 性 (polynomial time many-one reducibility) 。 
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3SAT 多 项 式 时 间 可 归 约 到 CLIQUE 。 

证 明 思 路 ”给 出 从 3SAT 8| CLIQUE 的 多 项 式 时 间 归 约 f， 它 把 公式 转化 为 图 。 在 构 
造 的 图 中 ， 指 定 大 小 的 团 对 应 于 公式 的 满足 赋值 。 图 中 的 结构 被 设计 好 用 来 模拟 变量 和 子 
句 的 作用 。 

证 明 设 $ 是 上 个 子 句 的 公式 ， 如 

$= kar Vb, Vici) A Caz V be V ird Aves A Cag Vb V ce) 
归 约 f 生成 字符 串 GLAD, HPC 是 如 下 定义 的 无 回 图 。 

G 中 的 结 点 分 成 & 组 ， 每 组 三 个 结 点 ， 称 为 三 元 组 (triple) 与 ,，…，, 碌 。 每 个 三 元 组 对 
应 于 $ 中 的 一 个 子 名 ， 三 元 组 中 的 每 个 结 点 对 应 于 相应 子 句 的 一 个 文字 。G 的 每 个 结 点 用 
它 对 应 的 $ 中 的 文字 做 标记 。 

除 两 种 情形 以 外 ，G 的 边 连接 了 所 有 的 结 点 对 。 
同一 个 三 元 组 内 的 结 点 无 边 相 连 ， 相 反 标 记 的 两 个 
结 点 无 边 相 连 ， 如 zs 和 zz。 例如 当 p= Ca Var V 
x2) N Ca V 22 V z2) A Cai Vez V z2) 时 ,图 7-7 表 
示 了 这 种 构造 。 

现在 说 明 这 种 构造 为 何 能 发 挥 作 用 ,证 明 是 
可 满足 的 当 且 仅 当 G 有 大 团 。 a ES Erie Se n 

假定 $ AERA. EMER, PAPA (Ve VAG Ve V zz) 生成 的 图 
中 至 少 一 个 文字 为 真 。 在 G 的 每 个 三 元 组 中 ， 选 择 在 该 满足 赋值 下 为 真 的 文字 对 应 的 结 
点 。 如 果 在 某 一 子 句 中 不 止 一 个 文字 为 真 ， 任 意 选 择 一 个 真 文字 即 可 。 选 择 出 来 的 结 点 将 
恰好 形成 一 个 二 团 。 因 为 是 从 & 个 三 元 组 中 的 每 一 个 中 挑选 一 个 结 点 ， 所 以 选择 的 结 点 数 
为 k。 每 一 对 选中 的 结 点 都 有 边 相 连 ， 它 们 都 不 是 前 面 描 述 的 两 种 例外 情形 。 它 们 不 可 能 
来 目 同 一 三 元 组 ， 因 为 从 每 个 三 元 组 中 只 选 一 个 结 点 。 它 们 也 不 可 能 有 相反 标记 ， 因 为 它 
们 关联 的 文字 在 该 满足 赋值 下 都 为 真 。 所 以 G 包含 &- 团 。 

假定 G 有 &- 团 。 因 为 在 同一 个 三 元 组 中 的 结 点 都 无 边 相 连 ， 所 以 团 中 的 任何 两 个 结 点 
都 不 在 同一 个 三 元 组 中 。 因 此 有 个 三 元 组 中 的 每 一 个 都 恰好 包含 团 的 一 个 结 点 。 给 $ 的 变 
量 赋 真 值 ， 使 得 标记 团结 点 的 每 个 文字 都 为 真 。 这 可 以 办 到 ， 因 为 具有 相反 标记 的 两 个 结 
点 无 边 相 连 ， 所 以 不 可 能 两 个 都 在 团 中 。 给 变量 的 这 种 赋值 满足 8%， 因 为 每 个 三 元 组 包含 
一 个 团结 点 ， 所 以 每 个 子 句 包含 一 个 赋值 为 TRUE 的 文字 。$ 可 满足 。 m 

EM 7. 25 和 定理 7.26 说 明 ， 如 果 CLIQUE 在 多 项 式 时 间 内 可 解 ， 那 么 3SAT 也 如 
此 。 乍 一 看 ， 这 两 个 问题 之 间 的 联系 显得 很 不 寻常 ， 因 为 表面 上 它们 是 非常 不 同 的 。 但 是 
多 项 式 时 间 可 归 约 性 允许 把 它们 的 复杂 性 联系 起 来 。 现 在 转向 一 个 定义 ， 它 允许 用 类 似 的 
方式 把 一 整 类 问题 的 复杂 性 联系 起 来 。 





7.4.2 NP 完全 性 的 定义 
如 果 语 言 B 满足 下 面 两 个 条 件 ， 就 称 为 NP 完全 的 (NP-complete): 
1.B 属 于 NP， 并且 
2. NP 中 的 每 个 A 都 多 项 式 时 间 可 归 约 到 B。 
若 上 述 的 BB 是 NP 完全 的 ， 且 BEP， 则 P=NP, 
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证 明 ”从 多 项 式 时 间 可 归 约 性 的 定义 直接 可 得 。 m 

若 上 述 的 B 是 NP Z2H, BB<,C, C&TNP, MCZNPZAAH. 

证 明 已 知 C 属 于 NP， 必 须 证明 NP 中 每 一 个 A 都 多 项 式 时 间 可 归 约 到 C。 因 为 B 
是 NP 完全 的 ， 所 以 NP 中 的 每 个 语言 都 多 项 式 时 间 可 归 约 到 B, m B 又 多 项 式 时 间 可 归 
约 到 C 。 多 项 式 时 间 归 约 是 可 以 复合 的 ， 即 若 A 多 项 式 时 间 可 归 约 到 B， 且 C 多 项 式 时 间 
可 归 约 到 B， 则 A 多 项 式 时 间 可 归 约 到 C。 因 此 NP 中 的 每 个 语言 都 多 项 式 时 间 可 归 约 到 
E ia 


7.4.3 库 克 - 列 文 定理 


一 旦 有 了 一 个 NP 完全 问题 ， 就 可 以 从 它 出 发 ， 通 过 多 项 式 时 间 归 约 得 到 其 他 NP 完 
全 问题 。 然 而 ， 建 立 第 一 个 NP 完全 问题 更 加 困难 。 现 在 ， 通 过 证 明 SAT 是 NP 完全 的 来 
完成 这 一 步 。 

SAT 是 NP 完全 的 。9 

该 定理 以 男 一 种 形式 描述 了 定理 7. 22. 

证 明 思 路 ”证 明 SAT 属于 NP 是 简单 的 ， 下 面 很 快 就 要 证 明 它 。 证 明 的 难点 是 要 证 
NP 中 的 任何 语言 都 多 项 式 时 间 可 归 约 到 SAT. 

为 此 ， 给 NP 中 的 每 一 个 语言 A 构造 一 个 到 SAT 的 多 项 式 时 间 归 约 。A 的 归 约 在 字 
Bw 上 产生 布尔 公式 &， 用 它 模拟 A 的 NP 机 器 在 输入 w 上 的 运行 。 如 果 机 器 接受 ， 那 
么 p 有 一 个 满足 赋值 对 应 于 接受 计算 。 如 果 机 器 不 接受 ， 那么 没有 赋值 能 满足 $4。 因此 ， 
HHNH 可 满足 时 ，w 属于 A。， 

实际 上 上， 虽然 必须 处 理 很 多 细节 ， 但 是 构造 一 个 以 这 种 方式 运算 的 归 约 在 概念 上 是 简 
单 的 。 一 个 布尔 公式 可 以 包含 布尔 操作 AND, OR 和 NOT， 这 些 操作 形成 了 电子 计算 机 
中 使 用 的 电路 的 基础 。 因 此 ， 可 以 设计 布尔 公式 来 模拟 图 灵机 这 一 事实 上 毫 不 令 人 奇怪 。 细 
节 在 于 这 种 思想 的 实现 上 。 

证 明 首先 ,证 明 SAT 属于 NP。 非 确定 型 多 项 式 时 间 机 器 可 以 猜测 给 定 的 公式 $ 的 
一 个 赋值 ， 当 赋值 满足 $ 时 接受 。 

Fl, MNP 中 任 取 一 个 语言 A， 证 明 A 多 项 式 时 间 可 归 约 到 SAT。 设 NN 是 在 时 间 
n* 内 判定 A 的 非 确定 型 图 灵机 ,是 某 个 常数 。( 为 了 方便 ， 实 际 上 假定 N 在 时 间 n* 一 3 
内 运行 ， 但 只 有 那些 对 细 市 感 兴 趣 的 读者 可 能 会 担心 这 个 次 要 的 地 方 .) 下 面 的 概念 有 助 
于 描述 该 归 约 。 

在 w 上 ，NN 的 对 应 画面 (tableau) 是 一 张 x* Xn 的 表格 ， 其 中 行 代表 N 在 输入 w 
上 的 一 个 计算 分 支 的 格局 ， 如 图 7- 8 所 示 。 

为 了 方便 ， 以 后 假定 每 一 个 格局 都 以 符号 # 开 始 和 结束 ， 这 样 画 面 的 第 一 列 和 最 后 一 
IEH S. MAKETE NEw 上 的 起 始 格 局 ， 每 一 行 都 根据 N 的 转移 函数 从 上 一 
行 得 到 。 如 果 画 面 的 某 一 行 是 接受 格局 ， 则 称 该 画面 为 接受 的 〈accepting) 。 

NEw 上 的 每 一 接受 画面 对 应 NN Ew 上 的 一 个 计算 分 支 。 所 以 判定 N 是 否 接受 w 
的 问题 等 价 于 判定 是 否 存在 N Æw 上 的 接受 画面 的 问题 。 


O ”该 定理 的 另 一 种 证 明 出 现在 9. 3 节 。 
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Al 7-8 对 应 画面 是 nw*Xn* 的 格局 表 


现在 开始 描述 从 A 到 SAT 的 多 项 式 时 间 归 约 f 。 在 输入 w 上， 该 归 约 产生 一 个 公式 
po thie 6 的 变量 开始 。 设 Q 和 工分 别 是 NN 的 状态 集 和 带子 字母 表 。 令 C=QUrU 
{#}, 对 于 每 个 介 于 1 到 六 之 同 的 和 3 以 及 C PEE s 有 有 一 个 变量 r 

(E) 个 画面 格子 中 的 每 一 格 称 为 一 个 单元 (cell)。 第 i 行 第 j 列 的 单元 称 为 cell[i,j]， 
并 且 包 含 C 中 的 一 个 符号 。 用 的 变量 表示 单元 中 的 内 容 。 若 zi,;,; 取 值 1， 则 意味 着 
cell[i,;j」 包 含 s。 

现在 设计 上 ， 使 得 变量 的 一 个 满足 赋值 确实 对 应 N 在 w 上 的 一 个 接受 画面 。 公式 g 
是 四 部 分 的 AND 运算 : geel A start A dmove A $accept， 依 次 描述 每 一 部 分 。 

如 前 面 所 述 ， 开 启 变量 xi,;,; 对 应 于 把 符号 s 放 进 cellLi,7]。 为 了 获得 在 赋值 与 画面 
之 间 的 对 应 ， 必 须 保证 的 第 一 件 事 是 赋值 为 每 个 单元 恰好 开启 一 个 变量 。 公 式 yc 确保 这 
一 要 求 ， 它 用 布尔 运算 的 语言 来 表达 这 一 点 : 

ye 一 A CCV tii AC A Crisis V tii) 


i<i,j<n' 


sft 
符号 人 A 和 V 代表 反复 出 现 的 AND 和 OR。 例 如 ， 上 面 公 式 中 的 一 部 分 
V Li,jss 
sec 


是 下 式 的 缩写 : 
Kida, V pas, VO V Sages, 

其 中 C 一 人 ss ，…5)。 因 此 ，yce 实 际 上 是 一 个 长 的 表达 式 ， 它 为 画面 中 的 每 个 单元 包 
含 一 个 片段 ， 因 为 ;和 7 从 1 变 到 玲 。 每 一 片段 的 第 1 部 分 称 在 相应 单元 中 至 少 一 个 变量 
被 开启 。 每 一 片段 的 第 2 部 分 称 在 相应 单元 中 至 多 一 个 变量 被 开启 〈 照 字面 意思 就 是 说 ， 
每 一 对 变量 中 至 少 有 一 个 被 关闭 ) 。 这 些 片 段 由 和 人 运算 连接 起 来 。 

gel 在 方 括号 中 的 第 1 部 分 规定 ， 至 少 有 一 个 与 每 个 单元 相关 联 的 变量 开启 ; 而 第 2 
部 分 规定 ， 对 每 个 单元 只 有 一 个 变量 开局。 满足 上 〈 从 而 也 满足 pen) 的 任何 变量 赋值 必 
定 使 得 对 每 个 单元 恰好 开启 一 个 变量 。 于 是 ， 任 何 满足 赋值 都 给 表 中 的 每 个 单元 指定 了 一 
个 符号 。$start ，$move 和 gaceept 等 部 分 保证 该 表格 确实 是 一 个 接受 画面 ， 如 下 。 

公式 $star 保 证 表 的 第 一 行 是 N Ew 上 的 起 始 格 局 ， 它 明确 规定 相应 的 变量 是 开局 的 : 


stot i ld A Tima A Em BA i 
0 1 2 n 


A. tiwag AA A A A Mia: 8 
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公式 gaceept 保 证 接受 格局 出 现在 画面 中 。 它 通过 规定 开局 相应 变量 之 一 来 确保 acco 
( 即 表示 接受 状态 的 符号 ) 出 现在 画面 的 某 一 单元 中 : 


Paccept T V Pa. 
1<i,j<n i 


最 后 ， 公 式 $move 保 证 画面 的 每 一 行 都 对 应 于 从 上 一 行 的 格局 按照 N 的 规则 合法 转移 
得 到 的 格局 。 它 通过 确保 每 一 个 2X3 窗口 单元 都 是 合法 的 来 保证 这 一 点 。 如 果 一 个 2X3 
的 窗口 不 违反 由 N 的 转移 函数 指定 的 动作 ， 则 称 该 窗口 是 合法 的 〈legal) 。 换 言 之 ， 如 采 
它 可 以 出 现在 从 一 个 格局 正确 地 转移 到 另 一 个 格局 的 过 程 中 ， 该 窗口 就 称 为 合法 的 .9 

HW, wa, b, c 是 市 子 字 母 表 的 成 员 ，g, Ma, 是 NN 的 状态 。 假 设 在 状态 gl ， 读 与 
头 读 取 a 时，NN 写 一 个 b,， 仍 在 状态 gy ， 并 且 右 移 。 在 状态 qi ， 读 写 头 读 取 b 时 ,NN 非 确 
定 地 : 

l. 写 一 个 c， 进 入 状态 q 并 左 移 ， 或 者 

2. 写 一 个 a， 进 入 状态 q FAB. 


形式 地 表示 为 6(qi,a) 二 {(qi,b,R)}, (qs b= fafao] alglb| Ba 
{(q yc,L)，(q ,a,R))。 该 机 器 的 合法 窗口 的 例 Lelalc| ajaja jalalb| 
子 如 图 7-9 Bras. (a) (b) (c) 
在 图 7-9 中 ,窗口 (a), (b) 是 合法 的 ， 因 |# ba aļoļa] 
为 转移 函数 允许 N 以 指明 的 方式 移动 。 窗口 co) HH deial lelei 


是 合法 的 ， 因 为 gq, 出 现在 顶 行 的 右边 ， 我 们 不 知 
道 读 写 头 在 什么 符号 上 边 。 那 个 符号 可 能 是 a, 图 7-9 合法 窗口 示例 
qi 可 以 把 它 变 为 b， 并 且 向 右 移 。 这 就 有 可 能 产生 该 窗口 ， 所 以 它 不 违反 N 的 规则 。 窗 口 
(d 显然 是 合法 的 ， 因 为 顶 行 与 底 行 是 相同 的 ， 当 读 写 头 与 窗口 的 位 置 不 相 邻 时 就 会 出 现 
这 种 情况 。 注 意 在 合法 窗口 中 ， 井 可 以 出 现在 顶 行 和 底 行 的 左边 或 右边 。 窗 口 (e) 是 合 
法 的 ， 因 为 紧 靠 顶 行 的 右边 可 能 就 是 状态 q 读 取 符号 b， 然 后 左 移 使 状态 q 出 现在 底 行 
的 右边 。 最 后 ， 窗 口 O 是 合法 的 ， 因 为 状态 q 可 能 紧 挨 着 顶 行 的 左边 ， 它 把 b 变 为 c， 
然后 左 移 。 

图 7- 10 所 示 的 窗口 对 于 机 器 N 不 是 合法 的 。 

在 窗口 (a) 中 ， 顶 行 中 间 的 符号 不 会 改变 ， 因 aon sete e 
为 没有 状态 与 它 相 邻 。 窗 口 b) 不 是 合法 的 ， 因 (a) (b) sele 
J eB eR HA b 应 变 为 c 而 不 是 a。 窗 口 (c) A 
eh 因为 在 底 行 出 现 了 两 个 状态 。 

如 果 画 面 的 顶 行 是 起 始 格局 ， 画 面 中 的 每 一 个 窗口 都 是 合法 的 ， 那 么 画 
面 的 每 一 和 部 是 关上- 行 合 法 转移 得 到 的 格局 。 

为 证 明 该 断言 ， 考 虑 画面 中 任何 两 个 相 邻 格局 ， 称 为 上 格局 和 下 格局 。 在 上 格局 中 ， 每 

一 个 包含 带子 符号 且 不 与 状态 符号 相 邻 的 单元 都 是 某 个 窗口 顶 行 的 中 间 单 元 且 窗 口 顶 行 不 含 

状态 。 因 此 该 符号 必定 保持 不 变 ， 出 现在 窗口 的 底 行 中 间 ， 即 出 现在 底 行 格局 的 同一 位 置 。 

窗口 顶 行 的 中 间 单 元 包含 着 状态 符号 ， 这 就 使 相应 的 三 个 位 置 按照 转移 函数 的 要 求 一 


图 7-10 非法 窗口 示例 


O 在 这 里 可 以 根据 转移 函数 给 出 合法 窗口 〈legal window) 的 精确 定义 。 但 这 么 做 是 非常 乏味 的 ， 而 且 使 人 从 证 
明 主 线 上 分 散 精力 。 想 要 更 精确 定义 的 读者 可 以 参考 定理 5. 11 〈 即 波斯 特 对 应 问题 ) 的 证 明 中 的 有 关 分 析 。 
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致 更 新 。 因 此， 如 果 上 格局 是 合法 格局 ， 那 么 下 格局 也 是 ， 并 且 下 格局 是 根据 N 的 规则 
从 上 格局 转移 得 到 。 注意 ， 这 个 证 明显 然 易 懂 ， 但 它 的 关键 依赖 于 选择 了 大 小 为 2X3 的 
窗口 ， 如 问题 7. 26 所 说 明 的 。 
现在 转 回 $move 的 构造 ， 它 规定 画面 中 的 所 有 窗口 都 是 合法 的 。 每 个 窗口 包含 6 个 单 
元 ， 它 们 可 以 用 固定 数目 的 方式 设置 为 合法 窗口 。 公 式 $move 指 出 ， 这 6 个 单元 的 设置 必 
须 是 这 几 种 方式 之 一 ， 即 
bmve= A CG j) -AO EARN) 


1<i<n ,1<j<n 
位 于 (i,7)- 窗 口 顶部 居中 位 置 的 是 单元 Li,;j]」]。 把 这 个 公式 中 的 文字 “(i,j)- 窗 口 是 合 法 
的 ”替换 为 下 面 的 公式 ， 把 窗口 的 6 个 单元 的 内 容 写 为 al ，… ,as 


V (35,5140, N Xi,j,a, N Xi,j+1,0, N Xi+1,j-1.a, N Xi+1,;,0, \ xXi+1,j+1,, ) 


是 一 个 合法 窗口 

下 面 分 析 归 约 的 复杂 性 ， 证 明 它 在 多 项 式 时 间 内 完成 。 为 此 考察 AWK). B35, fh 
计 一 下 它 的 变量 的 数目 。 回 忆 一 下 ， 画 面 是 一 个 nn*Xnt 表格 ， 所 以 它 包含 nt 个 单元 。 每 
个 单元 有 与 它 相 关联 的 /个 变量 ,，/ 是 C 中 符号 的 数目 。 因 为 /只 依赖 于 图 灵机 N ， 而 不 
依赖 于 输入 的 长 度 n， 所 以 变量 总 数 是 O(n2*)。 

估计 一 下 $$ 的 每 个 部 分 的 大 小 。 对 画面 的 每 个 单元 ， 公 式 gl 包含 固定 长 度 的 公式 片 
段 ， 所 以 长 度 为 O(n*)。 公 式 $start 对 顶 行 的 每 个 单元 包含 一 个 片段 ， 所 以 长 度 为 Ont). 
dmove 和 paccept 对 画面 的 每 个 单元 包含 固定 长 度 的 公式 片段 ， 所 以 它们 的 长 度 为 

(nt), FÆ, 的 总 长 为 O(n2**)。 该 结果 完全 符合 目标 ， 因 为 它 说 明 p 的 长 度 是 n 的 多 
pl 如 果 长 度 超过 了 多 项 式 关 系 ， 那 么 该 归 约 将 不 可 能 在 多 项 式 时 间 内 生成 它 。 (实际 
上 我 们 少 估 了 一 个 Odogn) 因子 ， 因 为 每 个 变量 的 下 标 可 以 达到 rw*， 要 把 它们 写 进 公 式 
可 能 需要 OClogn) 个 符号 。 但 是 这 个 外 加 的 因子 不 改变 结果 的 多 项 式 特性 。) 

为 看 出 能 在 多 项 式 时 间 内 生成 该 公式 ， 注 意 它 的 高 度 重复 性 。 公 式 的 每 一 部 分 由 许多 
几乎 相同 的 片段 组 成 ， 只 是 在 下 标 上 有 简单 的 变化 。 因 此 可 以 容易 地 构造 一 个 归 约 ， 在 多 
项 式 时 间 内 从 输入 w 生成 $。 s 

这 样 就 完成 了 库 克 - 列 文 定理 的 证 明 , 证 明 SAT 是 NP 完全 的 。 证 明 其 他 语言 的 NP 
完全 性 通常 不 需要 这 样 长 的 证 明 。NP 完全 性 还 可 以 通过 从 一 个 已 知 为 NP 完全 的 语言 
发 的 多 项 式 时 间 归 约 来 证 明 。 为 此 可 以 用 SAT, 但 是 用 3SAT( 即 在 定理 7. 26 之 前 定义 
的 SAT 的 特殊 情况 ) 通常 更 加 容易 。 回 忆 一 下 ，3SAT 的 公式 是 合 取 范式 形式 的 ， 每 个 
子 句 有 三 个 文字 。 首 先 ， 必 须 证 明 3SAT 自己 是 NP 完全 的 。 把 它 作为 定理 7. 30 的 推论 
来 证 明 。 

3SAT 2 NP 完全 的 。 

证 明 显然 3SAT 属于 NP， 所 以 只 需 证 明 NP 中 的 所 有 语言 都 在 多 项 式 时 间 内 归 约 
到 3SAT。 为 证 明 这 一 点 ， 一 种 方法 是 证 明 SAT 多 项 式 时 间 归 约 到 3SAT。 这 里 改 用 另 一 
种 方法 ， 修 改定 理 7. 30 的 证 明 ， 使 得 它 直 接 产 生 每 个 子 句 有 三 个 文字 的 合 取 范式 形式 的 
ie 

定理 7. 30 产生 的 公式 已 经 几乎 是 合 取 范 式 形式 的 了 。 公 式 gm 是 子 公式 的 大 合 取 ， 
每 个 子 公式 包含 一 个 大 析 取 以 及 析 取 的 大 合 取 。 因 此 yc 是 子 句 的 合 取 ， 已 经 是 cnf 形式 
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了 。 公 式 $start 是 变量 的 大 合 取 。 把 每 个 变量 看 作 长 为 1 的 子 句 ， 就 能 看 出 $siart 是 cnf。 公 
A $accert 是 变量 的 大 析 取 ， 因 此 是 单个 子 句 。 公 式 $move 是 唯一 一 个 还 不 是 cnf HAH, 但 
是 可 以 容易 地 把 它 转化 为 cnf 形式 的 公式 ， 如 下 所 述 。 

回忆 一 下 ，$move 是 子 公 式 的 大 合 取 ， 每 个 子 公 式 是 合 取 的 析 取 ， 描 述 了 所 有 可 能 的 合 
法 窗口 。 第 0 章 描述 的 分 配 律 指出 ， 可 以 把 合 取 的 析 取 替换 为 等 价 的 析 取 的 合 取 。 这 么 做 
可 能 会 极 大 地 增加 每 个 子 公 式 的 长 度 ， 但 是 $move 的 总 长 只 可 能 增加 常数 倍 ， 因 为 每 个 子 
公式 的 长 度 只 依赖 于 N。 结 果 是 合 取 范式 形式 的 公式 。 

现在 已 经 把 公式 写成 cnf 形式 了 人， 再 把 它 转化 为 每 个 子 句 拥 有 三 个 文学 的 形式 。 在 当 
前 拥有 一 个 或 两 个 文字 的 子 句 中 ， 复 制 其 中 一 个 文字 ， 使 得 文字 总 数 达到 3。 在 拥有 超过 
3 个 文字 的 子 句 中 ， 把 它 分裂 为 几 个 子 句 ， 额 外 添加 一 些 变量 来 保持 原 公 式 的 可 满足 性 或 
不 可 满足 性 。 

H, EFE (ai Vaz Va3 V as) 其 中 每 个 a; 是 一 个 文字 ) 替换 为 两 个 子 句 的 表达 
式 (a1 Vaz Vz)A(zVas3Va4)， 其 中 zz 是 新 变 元 。 如 果 ai 的 某 种 赋值 满足 原来 的 子 句 ， 
则 可 以 找到 z 的 某 种 赋值 ， 使 得 这 两 个 新 子 句 被 满足 ， 反 之 亦 然 。 一 般 地 说 ， 如 果子 句 包 
含 ! 个 文字 ， 如 

Cai V aa V we Vaz) 
则 可 以 用 /一 2 个 子 句 蔡 换 它 ， 如 
Ca; Vaz V 21) AKZ Vas V 22) A Cen Vag V za) Aves A Caa Väri V az) 

容易 验证 ， 新 公式 是 可 满足 的 当 且 仅 当 原来 的 公式 是 可 满足 的 ， 证 毕 。 i 


7.5 JLA NP 完全 问题 


NP 完全 性 现象 是 很 广泛 的 ， 众 多 领域 中 都 有 NP 完全 问题 。 由 于 某 些 没有 被 深入 认 
识 的 原因 ， 多 数 自 然 出 现 的 NP 问题 不 是 P 类 就 是 NP 完全 的 。 如 果 在 为 一 个 新 的 NP 问 
题 寻 找 多 项 式 时 间 算 法 ， 付 出 部 分 精力 尝试 证 明 它 是 NP 完全 的 是 一 种 明智 的 做 法 ， 因 为 
这 样 可 以 防止 去 寻找 一 个 并 不 存在 的 多 项 式 时 间 算 法 。 

本 节 再 给 出 几 个 定理 ， 证 明 几 个 不 同 的 语言 是 NP 完全 的 。 这 些 定理 为 同类 问题 的 证 
明 技 巧 提 供 了 示例 。 一 般 策略 是 给 出 从 3SAT 到 该 语言 的 多 项 式 时 间 归 约 ， 如 果 更 加 方便 
的 话 ， 有 时 也 从 其 他 NP 完全 语言 归 约 。 

在 构造 从 3SAT 到 一 个 语言 的 多 项 式 时 间 归 约 时 ， 我 们 寻找 这 个 语言 中 能 模拟 布尔 公 
式 的 变量 和 子 句 的 结构 ， 这 种 结构 有 时 称 为 构件 〈gadget) 。 例 如 ， 在 定理 7. 26 中 给 出 的 
从 3SAT 到 CLIQUE 的 归 约 中 ， 结 点 模拟 变量 ， 结 点 的 三 元 组 模拟 子 句 。 一 个 具体 的 结 
点 可 以 是 也 可 以 不 是 团 的 成 员 ， 这 对 应 于 一 个 变量 在 满足 赋值 中 可 以 是 真 ， 也 可 以 不 是 
真 。 每 个 子 句 必须 包含 赋值 为 真 的 文字 。 相 应 地 ， 每 个 三 元 组 必须 包含 团 的 一 个 结 点 A 
要 达到 规定 的 大 小 ) 。 下 面 是 定理 7. 26 的 推论 ， 说 明 CLIQUE 是 NP 完全 的 。 

CI CLIQUE 是 NP 完全 的 。 


7.5.1 顶点 覆盖 问题 


若 G 是 无 向 图 ， 则 G 的 顶点 覆盖 (vertex-cover) 是 结 点 的 一 个 子 集 ， 使 得 G 的 每 条 边 
都 与 子 集中 的 结 点 之 一 相关 联 。 顶 点 覆盖 问题 由 在 确定 图 中 是 否 存在 指定 规模 的 顶点 覆盖 : 
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VERTEX-COVER ={(G,k)|G 是 具有 上 个 结 点 的 顶点 履 盖 的 无 向 图 )} 

VERTEX-COVER 是 NP 完全 的 。 

证 明 思 路 ”要 证 明 VERTEX-COVER 是 NP 完全 的 ， 必 须 证 明 它 属于 NP ANP 中 的 
所 有 问题 都 能 多 项 式 时 间 归 约 到 它 。 第 一 部 分 较 容 易 : 证 书 就 是 一 个 规模 为 & 的 顶点 覆 
盖 。 通 过 证 明 3SAT 多 项 式 时 间 可 归 约 到 VERTEX-COVER 来 证 明 第 二 部 分 。 该 归 约 将 
一 个 3cnf 公式 6 转换 为 一 个 图 G 和 数值 &， 且 只 要 G 中 有 上 个 结 点 的 顶点 覆盖 ，# 就 能 够 
被 满足 。 转 换 是 在 不 知道 6 能 否 被 满足 的 情况 下 完成 的 。 实 际 上 ，G 模拟 了 4. RAS 
着 构件 、 模 拟 公 式 中 的 变量 和 子 句 。 设 计 这 些 构件 需要 一 点 独 出 心 裁 的 巧 思 ，。 

对 于 变量 构件 ， 在 G 中 寻找 一 种 结构 ， 它 以 两 种 可 能 的 方式 之 一 参与 到 顶点 覆盖 中 ， 
正好 对 应 变量 的 两 种 可 能 的 真实 赋值 。 变 量 构件 包含 两 个 被 一 条 边 连接 的 结 点 。 这 种 结构 
之 所 以 有 效 是 因为 两 个 结 点 之 一 一 定 会 出 现在 顶点 覆盖 中 。 任 意 地 将 两 个 结 点 分 别 与 
TRUE 和 FALSE 关联 起 来 。 

对 于 子 句 构件 ， 要 寻找 这 样 的 结构 : 它 使 得 顶点 覆盖 所 包含 的 变量 构件 结 点 中 ， 
至 少 有 一 个 结 点 对 应 着 该 子 句 中 至 少 一 个 取 值 为 真 的 文字 。 这 个 构件 包含 三 个 结 点 及 
它们 相连 的 边 ， 这 样 任 何 一 个 顶点 覆盖 都 一 定 会 包含 它 的 至 少 两 个 结 点 ， 或 者 是 全 部 
三 个 结 点 。 如 果 构 件 结 点 中 的 一 个 只 是 有 助 于 覆盖 仅仅 一 条 边 ， 则 顶点 覆盖 中 只 需 包 
括 男 外 两 个 结 点 ， 也 就 是 对 应 的 文字 满足 了 该 子 句 的 情况 。 否 则 ， 三 个 结 点 都 必须 覆 
盖 。 最 后 ， 选 择 & 值 使 得 找到 的 顶点 覆盖 一 个 结 点 对 应 一 个 变量 构件 ， 两 个 结 点 对 应 
一 个 子 句 构件 。 

证 明 这 里 给 出 一 个 从 3SAT 到 VERTEX-COVER 的 在 多 项 式 时 间 内 运算 的 归 约 的 
细 市 内 容 ， 该 归 约 把 布尔 公式 $ 映射 为 一 个 图 G AR, HF e 中 的 每 个 变量 x， 产 生 一 
条 连接 着 两 个 结 点 的 边 。 把 这 个 构件 中 的 两 个 结 点 标记 为 x MT. E r 赋值 为 TRUE 对 应 
于 顶点 覆盖 选择 该 边 的 左 结 点 ， 而 赋值 为 FALSE 对 应 于 标记 为 z 的 结 点 。 

对 应 于 子 句 的 构件 稍 有 点 复杂 。 每 个 子 句 的 构件 是 用 该 子 句 的 三 个 文字 标记 的 结 点 组 
成 的 三 元 组 。 这 三 个 结 点 互相 连接 ， 并 且 与 变量 构件 中 具有 相同 标记 的 结 点 相连 接 。 因 此 
出 现在 G 中 的 结 点 总 数 是 2m 十 31， 其 中 8 有 m 个 变量 和 /1 个子 句 。 令 等 于 m 十 21。 

HW, Æ p= Ca Va Vaz) AC Vr VT) A Vz Vaz:), BAM p 产生 (G,k), 
XE k=8, G 的 形状 如 图 7- 11 所 示 。 





图 7-11 BZA =la V zi V azz) AC V azz V 22) AG V z Vez) 产生 的 图 


为 证 明 该 归 约 满足 要 求 ， 需 要 证 明 g 可 满足 当 且 仅 当 G 有 个 结 点 的 项 点 覆盖 。 从 一 
个 满足 赋值 开始 ， 首 先 把 变量 构件 中 对 应 于 赋值 中 真 文字 的 结 点 放 入 顶点 覆盖 中 。 然 后 ， 
在 每 个 子 句 中 挑选 一 个 真 文 字 ， 把 每 个 子 句 构件 中 剩 下 的 两 个 结 点 放 入 顶点 覆盖 中 ， 现 在 
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共有 个 结 点 。 它 们 覆盖 所 有 边 ， 因 为 显然 每 个 变量 构件 的 边 被 覆盖 了 ， 在 每 个 子 句 构件 
中 的 所 有 三 条 边 也 被 履 盖 了 ， 所 有 介 于 变量 构件 和 子 句 构件 之 间 的 边 也 被 覆盖 了 。 所 以 G 
有 上 个 结 点 的 顶 后 覆盖 。 

其 次 ， 如 果 G 有 & 个 结 点 的 顶点 覆盖 ， 通 过 构造 满足 赋值 来 证 明 p 是 可 满足 的 。 为 了 
覆盖 变量 构件 的 边 和 子 句 构件 的 三 条 边 ， 顶 点 覆盖 必须 包含 每 个 变量 构件 的 一 个 结 点 以 及 
每 个 子 句 构件 的 两 个 结 点 。 这 就 占用 了 全 部 顶点 覆盖 的 结 点 ， 没 有 剩余 的 份额 。 选 取 变量 
构件 中 在 顶点 覆盖 中 的 结 点 ， 把 相应 的 文字 赋值 为 真 。 这 个 赋值 满足 4p， 因为 连接 变量 构 
件 和 每 个 子 句 构 件 的 三 条 边 都 被 覆盖 了 ， 而 子 句 构件 中 只 有 两 个 结 点 在 顶点 覆盖 中 ， 所 以 
其 中 一 条 边 必定 被 变量 构件 中 的 一 个 结 点 覆盖 ， 因 此 赋值 满足 相应 的 子 句 。 a 


7.5.2 哈密 顿 路 径 问 题 


回忆 一 下 ， 哈 密 顿 路 径 问 题 是 问 输入 图 是 否 包 含 从 s 到 t 恰好 经 过 每 个 结 点 一 次 的 

路 径 。 
HAMPATH 是 NP 完全 的 。 
证 明 思 路 在 7.3 节 已 经 证 明了 HAMPATH 属于 NP 的 。 为 证 每 个 NP 问题 多 项 式 
时 间 可 归 约 到 HAMPATH, RIER 3SAT 多 项 式 时 间 可 归 约 到 HAMPATH, 给 出 一 
种 方法 ， 把 3cnf 公式 转化 为 图 ， 使 得 图 中 的 哈密 顿 路 径 对 应 于 公式 的 满足 赋值 。 图 中 包 
含 模拟 变量 和 子 句 的 构件 。 变 量 构件 是 一 个 钻石 结构 ， 可 以 两 种 方式 之 一 经 过 ， 对 应 于 两 
种 真 值 赋值 。 子 名 构件 是 一 个 结 点 ， 保 证 路 径 经 过 每 个 子 句 构件 对 应 于 保证 在 满足 赋值 中 
每 个 子 句 都 被 满足 。 

证 明 前面 已 经 证 明 HAMPATH 属于 NP, 还 需要 做 的 就 是 证 明 3SAT 
<»p~,HAMPATH, 。 对 于 每 个 3cnf 公式 %， 我 们 说 明 怎 样 构造 一 个 包含 两 个 结 点 s 和 上 的 有 
向 图 C， 使 得 * 和 t 之 间 存 在 哈密 顿 路 径 当 且 仅 当 # 可 满足 。 

MEE k NTAH 3cnf 公式 g 开始 构造 : 

d= (ai Vb, Vici) A Caz V b2 Vez) Aves A Car V be V ce) 
其 中 每 个 a， b, c 是 文字 zi; Rai. Kao ces 的 1 个 变量 。 

现在 说 明 怎样 把 $ 转化 为 图 G。 构 造 的 图 G 使 用 不 同 的 部 分 表示 出 现在 $ 中 的 变量 和 
E 

把 每 个 变量 zi 表示 为 一 个 包含 一 行 水 平 结 点 的 钻石 形 结 构 ， 如 图 7- 12 所 示 。 随 后 说 明 
水 平行 包含 的 结 点 数 。 

把 $ 的 每 个 子 句 表示 为 单个 结 点 ， 如 图 7- 13 所 示 。 
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图 7-12 变量 r: 表示 为 一 个 钻石 形 结构 图 7-13 EFA c 表示 为 结 点 


P7F EAA d 
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图 7-14 描绘 了 C 的 全 局 结构 。 除 了 表示 变量 与 子 句 〈 它 包含 着 这 些 变量 ) 关系 的 边 没 


有 画 出 以 外 ， 它 展示 了 G 的 所 有 元 素 及 其 相互 关系 。 

下 面 说 明 怎样 把 代表 变量 的 钻石 与 代表 子 句 
的 结 点 连接 起 来 。 每 个 钻石 结构 都 包含 一 行 水 平 
结 点 ， 它 们 由 两 个 方向 的 边 连 接 起 来 。 在 水 平行 
上 除了 钻石 两 端的 两 个 结 点 以 外 ， 还 包含 3k 十 1 
个 结 点 。 这 些 结 点 被 分 成 相 邻 的 对 ， 每 个 子 句 一 
对 ， 并 且 用 另外 的 结 点 把 这 些 结 点 对 分 隔 开 ， 如 
图 7-15 所 示 。 

如 果 变 量 zi 出 现在 子 句 c; 中 ， 则 把 图 7- 16 
所 示 两 条 从 第 i 个 钻石 的 第 j 对 结 点 到 第 j 个 子 
句 结 点 的 边 添加 进去 。 

如 果 xz; 出 现在 子 句 c; 中 ， 则 把 图 7- 17 所 示 
两 条 从 第 i 个 钻石 的 第 j 对 结 点 到 第 j 个 子 句 结 
点 的 边 添加 进去 。 

把 每 一 子 句 中 出 现 的 每 个 zx; 或 ;所 对 应 的 边 
都 添加 进去 以 后 ，G 的 构造 就 完成 了 。 为 了 说 明 
这 种 构造 满足 要 求 ， 我 们 断言 ， 如 果 g 是 可 满足 
KW. WM s 到 z 存在 哈密 顿 路 径 ; 反之 ， 如 果 存 
XM REA, Ws 是 可 满足 的 。 








图 7-15 在 钻石 结构 中 的 水 平 结 点 


图 7-16， 当 子 句 c; 包含 zx; 时 添加 的 边 


假设 $ 是 可 满足 的 。 为 了 展示 从 到 的 哈密 顿 路 径 ， 首 先 忽略 子 句 结 点 。 路 径 从 * 开 
始 ， 依 次 经 过 每 个 外 石 ， 到 终止。 为 了 经 过 外 石 中 的 水 平 结 点 ， 该 路 径 从 左 到 右 〈 左 - 右 
式 )， 或 者 从 右 到 左 〈 右 - 左 式 ) 曲折 前 进 ， 由 g 的 满足 赋值 决定 是 哪 一 种 方式 。 如 果 r: 
赋值 为 TRUE， 就 以 左 - 右 式 通 过 相应 的 钻石 。 如 果 zx; 赋值 为 FALSE， 就 以 右 - 左 式 。 


图 7- 18 展示 了 这 两 种 可 能 。 








zag-zig 


图 7-17 XFA cj 包含 zi 时 添加 的 边 图 7- 18 左 - 右 式 和 右 - 左 式 通 过 钻石 ， 由 满足 赋值 决定 


200 RABY ARAB LH 


迄今 为 止 ， 该 路 径 覆 盖 了 G 中 除 子 句 结 点 以 外 的 所 有 结 点 。 通 过 在 水 平 结 点 上 增加 迁 
回路 ， 可 以 轻易 地 把 子 句 结 点 纳入 路 径 中 。 在 每 个 子 句 中 ， 选择 一 个 被 满足 赋值 赋 为 
TRUE 的 文字 。 

MREFA c; 中 选择 z; ， 就 能 在 第 ;个 钻石 的 第 7 对 结 点 上 绕 行 。 可 以 这 样 做 是 因为 
zi 必定 是 TRUE， 该 路 径 从 左 到 右 通 过 相应 的 钻石 。 所 以 连 到 结 点 cj 的 边 的 次 序 正 好 人 允 
许 绕 行 并 返回 。 

类 似 地 ， 如 果 在 子 句 c; 中 选择 了 Zz;， 就 能 在 第 i 个 钻石 的 第 j 对 结 点 上 绕 行 ， 因 为 zx; 必 
定 是 FALSE， 该 路 径 从 右 到 左 通过 相应 的 钻石 。 所 以 连 到 结 点 c 的 边 的 次 序 正好 也 人 允许 绕 
行 并 返回 。( 注 意 ， 子 句 中 的 每 个 真 文字 都 给 经 过 子 句 结 点 的 绕 行 提 供 了 一 种 选择 。 结 果 是 ， 
如 果子 句 中 有 几 个 文字 为 真 ， 则 只 选取 一 条 迁 回 路 。) 这 样 就 构造 好 了 所 需 的 哈密 顿 路 径 。 

对 于 相反 方向 的 证 明 ， 若 G 有 一 条 从 s Be 的 哈密 顿 路 径 ， 给 出 一 个 y 的 满足 赋值 。 
知 该 哈密 顿 路 径 是 正规 的 ， 即 除了 到 子 句 结 点 的 绕 行 以 外 ， 它 从 上 到 下 依次 通过 每 个 钻 
石 ， 则 容易 获得 满足 赋值 。 若 它 以 左 - 右 式 通过 钻石 ， 则 把 相应 变量 赋 为 TRUE; 若是 右 - 
左 式 ， 则 赋 为 FALSE。 因 为 每 个 子 句 结 点 都 出 现在 路 径 上 ， 通 过 观察 经 过 它 的 迁 回路 线 
的 情况 ， 可 以 确定 相应 的 子 句 中 哪个 文字 为 TRUE。 | 

现在 还 需 证 明 的 就 是 哈密 顿 路 径 肯 定 是 正规 的 。 违 反正 
规 性 的 唯一 途径 是 路 径 从 一 个 钻石 进入 子 句 结 点 ， 却 返回 到 
男 一 个 钻石 ， 如 图 7- 19 Pra. 

路 径 从 结 点 a 到 cc， 但 是 没有 返回 到 同一 钻石 的 cz， 而 
是 返回 到 不 同 钻石 的 b. FEX, N a: 或 者 as 必定 是 分 
隅 结 点 。 如 果 a: 是 分 隔 结 点 ， 则 进入 a: 的 边 只 能 来 自 a 和 
azs WẸ as 是 分 隔 结 点 ， 则 a 和 az 在 同一 子 句 对 中 ， 因 此 
进入 az 的 边 只 能 来 自 ar, a3 和 c。 在 这 两 种 情况 下 ， 该 路 
径 都 不 可 能 包含 结 点 a. ERA BEM c 或 al 进入 az ， 因 为 
它 从 这 两 个 结 点 出 发 通 向 别 的 地 方 去 了 。 它 也 不 可 能 从 as 图 7-19 这 种 情况 不 可 能 发 生 
进入 az ， 因 为 as 是 唯一 仅 存 的 a 所 瞄 向 的 结 点 ， 它 退出 a 后 必须 经 过 as 。 所 以 哈密 顿 
路 径 一 定 是 正规 的 。 该 归 约 显然 在 多 项 式 时 间 内 运算 ， 证 毕 。 a 

下 面 考虑 一 种 无 癌 的 哈密 顿 路 径 问 题 ， 称 为 UHAMPATH。 为 了 证 明 UHAMPATH 
是 NP 完全 的 ， 给 出 从 有 向 的 哈密 顿 路 径 问 题 出 发 的 多 项 式 时 间 归 约 。 

UHAMPATH 是 NP 完全 的 。 

证 明 对 于 包含 结 点 s 和 上 的 有 向 图 G， 归 约 构 造 包 含 结 点 s 和 + 的 无 向 图 G’。 图 G 
AM s 到 t 的 哈密 顿 路 径 当 且 仅 当 G 有 从 s' 到 :的 哈密 顿 路 径 。 描 述 G 如 下 。 

除了 s 和 t 以外，G 的 每 个 结 点 & 被 替换 为 G 的 三 个 结 点 u, umdi, ut, GWA sAr 
被 替换 为 G 的 结 点 o =s 和 姻 = 上 。G 有 两 种 类 型 的 边 。 首 先 有 连接 xmid 与 如 以 及 xmid 与 
uR., HRK, WR G 中 有 从 到 wv 的 边 ， 则 we™ 与 vw* 有 边 相 连 。 这 就 完成 了 G 的 构造 。 

通过 证 明 G 有 从 s Ble 的 哈密 顿 路 径 当 且 仅 当 G “有 从 su Sl t* 的 哈密 顿 路 径 ， 可 以 说 
明 这 种 构造 满足 要 求 。 为 证 明 一 个 方向 ， 注 意 到 G 中 的 哈密 顿 路 径 P 

SoU 9U29°** seusst 


在 G 中 有 一 条 对 应 的 哈密 顿 路 径 卫 : 
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为 证 明 另 一 个 方向 ， 我 们 断言 G 中 的 任何 从 so 到 让 的 哈密 顿 路 径 都 如 同 刚刚 描述 的 
路 径 P' 那 样 ， 必 定 是 从 结 点 的 一 个 三 元 组 通 向 另 一 个 三 元 组 ， 起 始 与 结束 的 地 方 除外 。 
这 就 将 完成 本 证 明 ， 因 为 这 样 的 路 径 在 G 中 都 有 对 应 的 哈密 顿 路 径 。 通 过 从 结 点 OR, 
跟踪 该 路 径 来 证 明 本 断言 。 注 意 到 路 径 上 的 下 一 个 结 点 必定 是 uP (对 某 个 i ， 因 为 只 有 那 
些 结 点 与 sx: 相连。 再 下 一 个 结 点 必定 是 xmid ， 因 为 在 哈密 顿 路 径 中 ， 其 他 方式 都 不 能 包括 
uid, Æ ui 以 后 是 ut, AARE u 连接 到 的 另 一 个 唯一 的 结 点 。 再 下 一 个 结 点 必 征 是 
ur 〈 对 某 个 力 ， 因 为 没有 别 的 结 点 可 以 连接 到 wp: 。 重 复 这 种 推理 直到 到 达 oH IE. s 


7.5.3 子 集 和 问题 


回忆 定理 7. 21 中 定义 的 SUBSET-SUM 问题 。 在 该 问题 中 ， 有 一 个 数 集 zl ，…… ,zk 和 
一 个 目标 数 上 ， 要 判定 该 数 集 是 否 包含 一 个 加 起 来 等 于 :的 子 集 。 现 在 证 明 该 问题 是 NP 完 
全 的 。 

SUBSET SUM 是 NP 完全 的 。 

证 明 思 路 ”定理 7. 21 中 已 经 证 明了 SUBSET-SUM 属于 NP。 通 过 把 NP 完全 语言 
3SAT 归 约 到 它 来 证 明 NP 中 的 所 有 语言 都 多 项 式 时 间 可 归 约 到 SUBSET-SUM。 给 定 一 
个 3cnf 公式 4， 构造 问题 SUBSET-SUM 的 一 个 实例 ， 使 其 包含 加 起 来 等 于 目标 t 的 子 集 
当 且 仅 当 y 可 满足 。 该 子 集 称 为 工 。 

为 了 获得 此 归 约 ， 寻 找 SUBSET-SUM 问题 的 结构 来 表示 变量 和 子 句 。 我 们 构造 的 
SUBSET-SUM 问题 的 实例 包含 以 十 进 制 表示 的 很 大 的 数 。 用 数 对 来 表示 变量 ， 用 数 的 十 
进 制 表 示 的 某 些 位 来 表示 子 句 。 

用 两 个 数 yi 和 z; 来 表示 变量 zi 。 证 明 对 于 每 个 ?1，yw 或 是 z; 必定 在 TT 中， 以 此 建立 
起 在 满足 赋值 中 x: 的 真 值 的 编码 。 

每 个 子 句 位 置 包含 目标 t 中 的 某 一 值 ， 这 就 对 子 集 了 提出 一 定 的 要 求 。 证 明 这 种 要 求 
与 相应 子 句 中 的 要 求 是 一 致 的 ， 即 要 求 该 子 句 的 文字 
IN TRUE. 

证 明 已 知 SUBSET-SUM ENP， 所 以 现在 来 证 
HH 3SAT<,SUBSET-SUM 。 

WgH—-THRAX, HERE mi "wz TA 
是 cister JAA $ 转化 为 SUBSET-SUM 问题 的 
一 个 实例 St), HPS 的 元 素 和 数 上 是 图 7- 20 中 以 
通常 的 十 进 制 记 法 表示 的 行 。 双 线 上 面 的 行 标记 为 

yiyzliyy2y 229 syl Zh g1 shi g2 sh2 °° BE 
它们 组 成 S 的 元 素 。 双 线 下 面 的 行 是 i。 

FE, HAF p 的 每 个 变量 x;，S 包含 一 对 数 y: 
和 zx;。 这 些 数 的 十 进 制 表示 分 为 两 部 分 ， 如 图 7- 20 所 
示 。 左 边 部 分 由 1 和 随后 的 1 一 i 个 0 组成。 右边 部 分 
对 应 于 每 个 子 句 有 一 位 数字 ， 当 子 句 cj 包含 文字 zi 时 图 7-20 从 3SAT 到 
yi 在 cj; 列 为 1; 当 子 句 cj 包含 文字 zi 时 zi 在 cj WH SUBSET-SUM 的 归 约 
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1。 未 指明 为 1 的 位 都 是 0。 

图 7- 20 根据 样 例子 句 cl ，cz 和 cx 填写 了 一 部 分 : 

(xı V x2 V x3) ACz: V 23 Vers) Aves A (x3 VeVe) 

另外 ，S 对 于 每 个 子 句 cj 包含 一 对 数 g;，h;。 这 两 个 数 相 等 ， 由 1 和 随后 的 & 一 7 个 0 
组 成 。 

最 后 ， 目 标 数 上 〈 即 表 的 底 行 ) 由 /个 1 和 随后 的 & 个 3 组 成 。 

接 下 来 ， 说 明 这 种 构造 为 什么 能 满足 要 求 ， 证 明 $ 可 满足 当 且 仅 当 S 的 某 个 子 集 加 起 
EFT i 

假设 6 可 满足 ， 如 下 构造 S 的 子 集 。 在 满足 赋值 中 ， 如 果 zx; 赋值 TRUE， 则 选择 y;; 
如 果 zx; 赋值 FALSE， 则 选择 xz;。 如 果 把 已 经 选择 的 数 加 起 来 ， 则 头 /位 的 每 一 位 都 是 1， 
因为 对 每 个 i 都 选择 了 yy; 或 者 z;。 而 且 ， 后 位 的 每 一 位 都 介 于 1 和 3 之 间 ， 因 为 每 个 子 
句 都 被 满足 ， 所 以 包含 1 一 3 个 真 文 字 。 进 一 步 选择 足够 的 g 和 hh， 使 得 后 位 的 每 一 位 都 
加 到 3， 从 而 达到 目标 值 。 

设 S 的 一 个 子 集 加 起 来 等 于 上 。 在 注意 观察 之 后 ， 构 造 一 个 $ 的 满足 赋值 。 首 先 ，5S 
中 的 成 员 的 所 有 位 都 是 0 或 1。 其 次 ， 表 中 描述 S 的 每 一 列 最 多 包含 五 个 1。 因 此 当 S 的 
某 个 子 集 相 加 时 ， 不 会 有 到 下 一 列 的 进位 。 为 了 在 头 1 列 的 每 一 列 都 得 到 1， 子 集 对 每 个 i 
都 必须 包含 y: 或 者 z;， 但 又 不 能 同时 包含 二 者 。 

现在 构造 满足 赋值 。 如 果子 集 包 含 y;， 就 赋 zx; 为 TRUE， 否 则 赋 它 为 FALSE。 该 赋 
值 肯定 满足 8%， 因 为 后 & 列 的 每 一 列 之 和 总 是 3。 在 cj 列 ，g; Mh; 最 多 提供 2， 所 以 子 集 
中 的 y; 或 者 z; 在 该 列 必须 至 少 提 供 1。 如 果 是 y, WA 出 现在 c; 中 而 且 赋 值 为 
TRUE， 所 以 c; 被 满足 。 如 果 是 z;， 那 么 xz; 出 现在 c; 中 而 且 zi WH FALSE, PF cj 也 
被 满足 。 因 此 6 被 满足 。 

最 后 ， 必 须 保 证 该 归 约 可 以 在 多 项 式 时 间 内 完成 。 表 的 尺寸 大 约 是 (k 十 1)?， 每 一 格 


的 内 容 都 可 以 从 任何 6 中 轻易 地 计算 出 来 。 所 以 全 部 时 间 是 O(n?) 个 简单 步骤 。 a 
练习 
7.1 下 面 各 项 是 真是 假 ? 
a. 2n=O(n) b. n? =O(n) 
Ac. n? =O(nlog? n) Ad. nlogn=0O(n?) 
e. 37 = 20% f. 2?” 一 O(22 ) 
7.2 下 面 各 项 是 真是 假 ? 
3.7 一 0(27) b. 2n=o(n?) 
Ac. 2n=0(3") Ad. 1=o(n) 
e. n= o(logn) f. 1=o(1/n) 
7.3 下 面 哪 一 对 数 是 互 素 的 ? 写 出 求 得 结论 的 演算 过 程 。 
a. 1274 和 10 505 b. 7289 和 8029 
7.4 对 于 字符 串 w= baba 和 下 面 的 文法 CFG G， 试 填写 定理 7. 14 中 识别 上 下 文 无 关 语言 的 多 项 式 时 间 
算法 中 所 描绘 的 表 : 
SRI 
R~TR | a 


TTR] b 
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下 面 的 公式 是 可 满足 的 吗 ? 
(xV yp ACzVIACEVy)ACEV®D 
证 明了 在 并 、 连 接 和 补 运 算 下 封闭 。 
证 明 NP 在 并 和 连接 运算 下 封闭 。 
& CONNECTED= {(G)|G 是 连通 的 无 向 图 } 。 分 析 3. 3. 2 节 给 出 的 算法 ， 证 明 此 语言 属于 P。 
无 向 图 中 的 三 角形 (triangle) 是 一 个 3- 团 。 证 明 TRIANGLEEP, 其 中 TRIANGLE={(G)|G 
包含 一 个 三 角形 }。 
证 明 ALLprA 属 于 P. 
分 析 你 的 算法 的 时 间 复 杂 度 。 
a. WEAR EQpra EP. 
b. 对 语言 A， 如 果 A=A* ， 则 称 A 是 星 闭 的 〈star-closed) 。 给 出 测试 一 个 DFA 是 否 识 别 一 个 
星 闭 的 语言 的 多 项 式 时 间 算 法 。( 注 意 : EQNFA 属 于 PHR.) 
车 图 G 的 结 点 重新 排序 后 ，G 可 以 变 得 与 互 完全 相同 ， 则 称 G 与 互 是 同 构 的 〈isomorphic) 。 令 
ISO={(G,H)|G M H ÆRME). WEH ISOE NP. 


这 是 个 研究 化 简 〈resolution) 的 问题 。 化 简 是 证 明 cnf 公式 不 可 满足 性 的 一 种 方法 。 令 4=C A 
Cz Nee NOn 是 一 个 cnf 公式 ， C BAF. 令 C={G |G: 是 $$ 的 子 句 }。 每 一 步 化 简 都 在 C 中 
WAATA Cs 和 Cs ， 它 们 有 相同 的 变量 xz， 在 一 个 子 句 中 为 -<， 另 一 个 中 为 二 .例如 Ca =Car V 
yi V y2 Vee V yD M C S5 CEV za Vz VeV za), HP y: 和 z; 都 是 文字 。 我 们 构成 一 个 新 的 子 名 
(y1V yzV…V yeVziV zzV…Vz1) 并 去 掉 重复 的 文字 。 将 新 的 子 句 添加 进 C 中。 重复 化 简 步 
又 ， 直 到 不 再 有 新 的 子 名 产生。 如果 C 中 有 空子 句 O, MKA g 是 不 可 满足 的 。 

如 果 该 化 简 方 法 不 会 将 可 满足 的 公式 误 判 为 不 可 满足 的 ， 则 称 其 为 正确 的 〈sound) 。 如 果 
该 化 简 方 法 一 定 会 将 不 可 满足 的 公式 判 为 不 可 满足 的 ， 则 称 其 为 完备 的 〈complete) 。 
a. 证 明 该 化 简 方 法 是 正确 且 完 备 的 。 
b. 使 用 (a) 部 分 证 明 2SATEP。 
证 明 PERAS FHA 4AM P=NP. 
设 ACl* 是 任意 一 元 语言 。 证 明 : GABRNP SSH, ABAP=NP. (ATF: 考虑 从 SAT BA 
的 多 项 式 时 间 归 约 f. MAK gp > poo HK p PRM 11, t2, r3 和 x4 分 别 置 为 0，1，0 和 0 
后 的 归 约 公式 。 对 指数 多 个 归 约 公式 运用 f 会 发 生 怎样 的 情况 ?) 
在 有 向 图 中 ， 一 个 结 点 的 入 度 Cindegree) 为 所 有 射 人 边 的 总 数 ， 出 度 〈outdegree) 为 所 有 射出 边 
的 总 数 。 证 明 如 下 问题 是 NP 完全 的 。 给 定 一 个 无 向 图 G 和 一 个 G 结 点 的 子 集 C， 是 否 可 以 通过 给 
G 的 每 条 边 赋予 方向 ， 将 G 转换 为 一 个 有 向 图 并 且 满 足 属 于 C 的 结 点 的 人 度 或 出 度 为 0， 不 属于 C 
的 结 点 的 人 度 至 少 为 1? 
如 果 一 个 正则 表达 式 不 含 * 运算 ， 则 称 为 无 * 的 〈star-free) 。 令 EQsrrex={(R,S)|RAS 是 等 
价 的 无 * 正则 表达 式 } 。 证 明 EQsrFREx 在 coNP 中 。 为 何 这 个 证 明 不 能 用 于 通常 的 正则 表达 式 ? 
差 层 次 (difference hierarchy) D;P 递归 定义 如 下 : 
a. Di P= NP, 


b. DiP 二 {A|A 二 B\C,B 属于 NP,C 属 于 Di_1P}。( 这 里 B\C=BNC.) 
Sli, DP 中 的 一 个 语言 是 两 个 NP 语言 的 差 。 有 时 DzP 称 为 DP (也 可 以 写成 DIE)。 令 
Z 二 {4《G1 ski sG2,k2)|Gi Æ ki- HEG: RA kz- W) 
证 明 Z 对 DP 是 完全 的 。 换 言 之 ,， 证明 ZEDP PH DP 中 的 每 个 语言 多 项 式 时 间 可 归 约 到 Z。 
令 MAX-CLIQUE= {(G,k)|G 中 最 大 团 的 大 小 恰好 为 k}。 利 用 问题 7. 18 的 结果 证 明 MAXCLIQUE 
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是 DP 完全 的 。 
令 f: NN 为 任意 f(n)=o(n logn) 的 函数 。 证 明 TIME(f(n)) 中 只 含有 正则 语言 。 
如 果 两 个 布尔 公式 有 相同 的 变量 集 且 有 同样 的 满足 赋值 集 〈 就 是 说 它们 描述 了 同样 的 布尔 功 
能 )， 则 称 它们 等 价 (equivalent)。 最 小 布尔 公式 是 指 没 有 比 它 更 短 的 等 价 公 式 。 令 MIN-FOR- 
MULA 是 最 新 布尔 公式 集 。 证 明 : 如 果 P=NP, Wl MIN-FORMULA €P, 
修改 定理 7. 14 的 证 明 中 识别 上 下 文 无 关 语言 的 算法 ， 给 出 一 个 多 项 式 时 间 算 法 ， 使 它 在 输入 一 
个 字符 串 和 一 个 CFG 时 ， 若 该 文法 生成 该 字符 串 ， 则 它 能 产生 该 字符 串 的 语法 分 析 树 。 
对 于 一 个 含有 六 个 变量 及 < 个 子 句 的 cnf 公式 ， 证 明 可 在 多 项 式 时 间 内 构造 一 个 有 O Cem) 个 状 
态 的 NFA， 它 接受 所 有 用 长 度 为 m 的 布尔 串 表 示 的 不 满足 赋值 。 得 出 结论 : 最 小 化 NFA 的 问 
题 无 法 在 多 项 式 时 间 内 解决 ， 除 非 P=NP. 
2cnf 公式 是 子 句 的 AND， 其 中 每 个 子 句 是 至 多 两 个 文字 的 OR. $ 2SAT={((6) |o 是 可 满足 的 
2cnf A}. WEH 2SATEP。 
考虑 下 面 的 算法 MINIMIZE, LL DFA M 为 输入 ， 输 出 DFA M: 
MINIMITIZE 王 “对 输入 〈M) ， 其 中 M=(Q,3,6,q,,A) 是 DFA: 
1. 把 M 的 从 起 始 状态 出 发 不 可 达 的 状态 全 部 删除 。 
2. 以 M 的 状态 为 结 点 ， 构 造 下 面 的 无 向 图 C。 
3. 在 G 中 的 每 一 个 接受 状态 和 每 一 个 非 接受 状态 之 间 连 一 条 边 。 另 外 如 下 添加 补充 的 边 。 
4. 反复 执行 下 面 的 步骤 ， 直 到 G 中 无 新 边 加 入 为 止 : 
5 MFM 中 每 一 对 不 同 的 状态 g 和 以 及 每 一 个 a €3: 
6 如 果 (6(q,a)，6(Cr,a)) 是 G 的 一 条 边 ， 就 把 边 q., r) MACH. 
7. 对 于 每 个 状态 g, S Lo] 代表 状态 的 集合 : [qj 二 {rE Qlg 和 7 在 G 中 无 边 相 连 }。 
8. 形成 一 个 新 的 DFA M= ZS, qo A), HP OU={[ql]leEQ}, E [qj 二 [r]， 则 Q 中 只 
保留 其 中 一 个 ); 对 每 个 gE€Q 和 aE€5 有 5 (Lg],a) 二 [6(q,a)]; qo =l]; A={LgllgeA}. 
9. 输出 〈M ) 。” 
a. 证 明 M 与 M’ 4. 
b. 证 明 M 极 小 ， 即 没有 更 少 状态 的 DFA 能 识别 同样 的 语言 。 可 以 无 须 证 明 就 使 用 问题 1. 48 的 
结果 。 
c. 证 明 MINIMIZE 在 多 项 式 时 间 内 运行 。 
在 库 克 - 列 文 定 理 的 证 明 中 ， 定 义 窗 口 为 单元 的 2X3 矩形。 说 明 如 果 换 用 2X2 的 窗口 ， 为 什么 
会 使 证 明 失 效 。 
这 个 问题 来 源 于 单 人 游戏 “扫雷 ”， 并 归结 到 图 。 令 G 是 一 个 无 向 图 ， 它 的 每 个 结 点 要 么 有 一 个 
隐藏 的 雷 ， 要 么 是 空 的 。 游 戏 者 一 个 一 个 地 选择 结 点 。 如 果 游 戏 者 选择 了 有 雷 的 结 点 ， 则 失败 。 
如 果 选 择 了 一 个 空 结 点 ， 则 可 以 知道 该 结 点 的 相 邻 结 点 中 共有 多 少 雷 。( 相 邻 结 点 即 同 该 结 点 有 
边 相 连接 的 结 点 。) 如 果 所 有 的 空 结 点 都 被 选中 了 ， 则 游戏 者 获胜 。 
K Gb) 雷 相 连 问题 是 一 个 图 ， 图 中 的 有 些 结 点 上 标记 了 数字 。 标 记 了 数字 m 的 结 点 v 表 
示 它 的 相 邻 结 点 中 有 wm 个 有 雷 ， 我 们 可 以 据 此 判定 其 他 结 点 中 是 否 有 雷 。 将 此 问题 形式 化 为 一 
个 语言 ， 并 证 明 它 是 NP 完全 的 。 
在 宝石 游戏 中 ， 有 一 个 mXm 格 的 棋盘 。 在 它 的 m 个 格子 中 ， 每 个 位 置 要 么 放 蓝 色 棋 子 ， BA 
放 红 色 棋 子 ， 要 么 什么 也 不 放 。 通 过 去 掉 棋 子 使 得 每 一 列 都 只 有 一 种 颜色 的 棋子 ， 每 一 行 都 至 
少 有 一 个 棋子 ， 达 到 此 目标 则 获胜 。 是 否 能 够 获胜 取决 于 初始 布局 。 令 SOLITAIRE={(G)|G 
为 可 获胜 的 游戏 布局 } 。 证 明 SOLITAIRE 为 NP 完全 的 。 
令 SET-SPLITTING={(S,C)|S#—-* #4 F#,C={CQi..Ce} 是 由 S 的 某 些 子 集 组 成 的 集 
A. k>0, HB S 的 元 素 可 以 被 染 为 红色 或 蓝 色 ， 而 且 对 所 有 Ci Ci 中 的 元 素 不 会 被 染 成 同一 
种 颜色 }。 证 明 SET-SPLITTING 是 NP 完全 的 。 
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思考 下 述 计 划 安 排 问 题 。 有 一 份 期 末 考 试 清单 Fi Fi 需要 安排 时 间 ， 学 生 清单 S1，…，, Si。 
每 个 学 生 都 选择 了 这 些 考试 的 某 个子 集 。 必 须 将 这 些 考 试 安排 到 各 时 段 中 ， 使 得 同一 时 段 中 不 
会 有 某 个 学 生 同 时 需要 参加 两 门 考 试 。 试 问 ， 如 果 只 用 hh 个 时 段 ， 是否 存在 合乎 要 求 的 计划 。 
将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 NP 完全 的 。 
回忆 一 下 ， 在 关于 丘 奇 -图 灵 论 题 的 讨论 中 ， 介绍 了 语言 D=(\p)|p 是 有 一 个 整数 根 的 多 变量 
多 项 式 }。 称 D 是 不 可 判定 的 ， 但 没有 给 出 证 明 。 在 本 问题 中 要 证 明 D 的 另 一 个 性 质 ， 即 DE 
NP 难 (NP-hard) 的 。 一 个 问题 是 NP 难 的 ， 如 果 NP 中 的 所 有 问题 都 多 项 式 时间 可 归 约 到 它 ， 
虽然 它 自己 可 能 不 在 NP 中 。 必 须 证 明 NP 中 的 所 有 问题 都 多 项 式 时 间 可 归 约 到 D. 
如 果 图 G 中 有 某 个 结 点 子 集 ， 其 他 结 点 都 至 少 与 该 子 集中 的 某 一 结 点 相 邻 ， 则 该 子 集 称 为 支配 
集 (dominating set), 4 

DOMINATING-SET={{G,k)|GA-*AASRAERHKRE) 
通过 从 VERTEX-COVER 问题 归 约 到 此 问题 来 证 明 它 是 NP 完全 的 。 
证 明 下 述 问题 是 NP HEZK., KARER RSq g) 以 及 配对 组 合集 (Gir), es 
(se,rk)}， 其 中 s 是 = 二 {40,1} 上 的 不 重复 的 字 串 ，r; 是 Q 的 成 员 〈 可 以 重复 ) 。 判 定 是 否 存在 
一 个 DFA M 王 (Q,3,6,go F), HEA i RA Ssi) Sri AEA, s) 是 M 在 状态 g ERS 
P ;后 进入 的 状态 。( 注 意 下 在 这 里 是 不 相关 的 。) 
令 U={《M,z,#')| 非 确定 型 图 灵机 M 在 至 少 一 个 分 支 上 在 上 步 内 接受 输入 x)}。 注 意 并 不 要 求 
M 在 所 有 分 支 上 停机 。 证 明 U 是 NP 完全 的 。 
证 明 : 者 P= 二 NP， 则 任 给 布尔 公式 p, Ep 是 可 满足 的 ， 则 存在 多 项 式 时 间 算 法 给 出 一 个 $ 的 
满足 赋值 。( 注 意 : 要 求 提供 的 算法 计算 一 个 函数 而 非 若 干 函 数 ， 除 非 是 NP 包含 的 语言 。P= 
NP 的 假定 说 明 SAT 在 P 中 ， 所 以 其 可 满足 性 的 验证 是 多 项 式 时 间 可 解 的 。 但 是 这 个 假设 没有 
说 明 这 项 验证 如 何 进行 ， 而 且 验 证 不 能 给 出 满足 赋值 。 必 须 证 明 它 们 一 定 能 够 被 找到 。 提 示 : 
重复 地 使 用 可 满足 性 验证 器 一 位 一 位 地 找 出 满足 赋值 。) 
证 明 : 若 P=NP， 则 可 以 在 多 项 式 时 间 内 将 整数 因子 分 解 。( 人 参见 问题 7. 35 的 提示 。) 

证 明 : 若 P=NP， 则 可 以 在 多 项 式 时 间 内 找 出 无 向 图 中 的 最 大 团 。( 人 参见 问 题 7. 35 的 提示 。) 
图 的 一 个 着 色 (Coloring) 是 给 结 点 指定 颜色 ， 使 得 相 邻 的 结 点 不 会 被 指定 为 同一 种 颜色 。 令 
3COLOR= {(G) |G 的 结 点 被 三 种 颜色 着 色 } 

证 明 3COLOR 是 NP 完全 的 。( 提 示 : 利用 下 面 三 个 子 图 。) 


Sarna 


调 色 板 变量 OR 构 件 
有 一 个 盒子 和 一 些 卡 片 ， 如 下 图 所 示 。 盒 子 里 有 栓塞 ,卡片 上 有 四 口 ， 所 以 每 张 卡片 可 以 两 种 方式 
放 人 盒子 中 。 每 张 卡片 上 有 两 排 孔 ， 有 些 孔 没有 打 穿 。 把 所 有 卡片 放 进 盒子 ， 使 得 盒子 的 底 被 完全 
覆盖 〈 即 ， 每 个 孔 的 位 置 都 被 至 少 一 张 在 该 位 置 上 无 孔 的 卡片 堵 住 )， 则 谜 题 就 算 破 解 了 。 令 
PUZZLE 王 {(cl,… ce)| 每 个 ci 代表 一 张 卡片 ,并 且 这 个 卡片 集 有 人 解 } 
证 明 PUZZLE 是 NP 完全 的 。 


盒子 


栓塞 过 
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令 
MODEXP= {<a,b,c,p)|a,b,c, p 是 二 进 制 整 数 ,使 得 a’ =c(mod p)} 
证 明 MODEXPEP。( 注 意 ， 最 明显 的 算法 不 在 多 项 式 时 间 内 运行 。 提 示 : WAWE b E 2 OY 
情况 。) 
集合 (1, =, k} 上 的 一 个 置换 (permutation 是 一 个 在 这 个 集合 上 的 一 对 一 的 映射 函数 。 令 p 
为 一 个 置换 ， 志 表示 p 自身 的 t 次 复合 。 令 
PERM-POWER=({(p.qot) |pHq KH pq 为 {1,…,k} 上 的 置换 ,t 是 二 进 制 整数 ) 
证 明 PERM-POWER ECP. GER, 最 明显 的 算法 不 在 多 项 式 时 间 内 运行 。 提 示 : 先 试 证 t+ 是 2 
EA) Fe AY) TL.) 
证 明 PP 在 星 号 运算 下 封闭 。( 提 示 : 使 用 动态 规划 。 对 于 任意 的 AEP， 对 输入 y= yt yw, H 
中 y: E33， 建 一 个 表 ， 表 示 对 于 每 个 ij, BREATHE yery EA* 2) 
WH NP 在 星 号 运算 下 封闭 。 
& UNARY-SSUM 是 所 有 数 用 一 进 制 表示 的 子 集 和 问题 。 为 什么 SUBSET-SUM 的 NP 完全 性 
的 证 明 不 能 用 来 证 明 UNARY-SSUM 是 NP 完全 的 ? 求证 UNARYSSUMEP。 
证 明 若 P=NP， 则 除了 语言 A 二 和 A=>* 以 外 ， 所 有 语言 ACP 都 是 NP 完全 的 。 
证 明 PRIMES= (m|m 是 二 进 制 表示 的 素数 }E NP。( 提 示 : 对 于 pol, RAR ZF 二 {x | x 与 
Pp 互 素 ,， 且 1 二 x<<p) 是 p 一 1 阶 循环 群 当 且 仅 当 嫁 是 素数 。 可 以 利用 这 一 事实 ， 无 有 顷 证 明 。 现 
在 已 知 PRIMESEP 为 真 ， 但 其 证 明 更 难 。) 
一 般 认 为 PATH 不 是 NP 完全 的 ， 请 说 明 原 因 。 证 明 如 果 PATH 不 是 NP 完全 的 ， 则 PANP. 
设 G 表示 无 向 图 ， > 
SPATH=={(G,a,b,k)|G 包含 从 a 到 5、 长 度 至 多 为 的 简单 路 径 } 
以 及 
LPATH 二 {(G,a,b,k)|G 包含 从 a 到 656、 长 度 至 少 为 k 的 简单 路 径 } 
a. 证 明 SPATHEP., 
b. 证 明 LPATH 是 NP 完全 的 。 
令 DOUBLE-SAT={(4)|¢ 至 少 有 两 个 满足 赋值 ;。 证 明 DOUBLE-SAT 是 NP 完全 的 。 
& HALF-CLIQUE ={(G)|G 是 无 向 图 ,包含 结 点 数 至 少 为 m/2 的 完全 子 图 , 是 G HARM). 
证 明 HALF-CLIQUE 是 NP 完全 的 。 
令 CNF: ={ (p) p 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 变量 最 多 出 现在 & 个 位 置 } 。 
a. 证 明 CNF: EP。 
b. WH CNF; 是 NP 完全 的 。 
& CNFy= { (p) | $ 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包含 任意 多 个 文字 ， 但 最 多 只 有 
一 个 文字 的 非 )。 证 明 CNFx EP, 
设 4 是 3cnf 公式 。 变 量 $ 的 关 一 赋值 (assignment) 是 使 每 个 子 句 包含 两 个 不 同 真 值 的 文字 的 赋 
值 。 换 言 之 ， 关 一 赋值 满足 $4， 而 又 不 在 任何 子 句 中 赋值 三 个 真 文字 。 
a. 证 明 g 的 任何 关 一 赋值 的 否定 依然 是 取 一 赋值 。 
b. ASAT 是 具有 关 一 赋值 的 3cnf 公式 的 集合 。 证 明 : 通过 把 每 个 子 句 ci 
Cyi V y2 V y3) 
换 成 两 个 子 名 
Cyr V y2 V zi) A(z: V y3 Vb) 

其 中 z 是 对 应 于 每 个 子 句 ci 的 新 变量 , 5b 是 一 个 补充 的 新 变量 ， 可 以 得 到 从 3SAT BASAT 

的 多 项 式 时 间 归 纳 。 
c HHASAT 是 NP 完全 的 结论 。 
无 向 图 的 一 个 割 Cud 是 把 顶点 集 V 分 裂 成 两 个 不 相交 的 子 集 S 和 耳 。 割 的 规模 是 一 端 在 S 中 ， 
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另 一 端 在 工 中 的 边 的 数目 。 令 

MAX-CUT={{G,k) |G 有 规模 不 少 于 kk HH} 
证 明 MAX-CUT 是 NP 完全 的 。 可 以 假定 问题 7. 53 的 结论 成 立 。 (提示 : WERASAT<,MAX- 
CUT 。 对 应 变量 z 的 构件 是 由 3c 个 标记 为 zx 的 结 点 和 3c 个 标记 为 去 的 结 点 组 成 的 集合 ， 这 里 c 
是 子 句 数 。 所 有 标记 为 xz 的 结 点 都 与 所 有 标记 为 未 的 结 点 相连 。 子 句 构 件 是 由 三 条 边 组 成 的 三 
角形 ， 这 三 条 边 连接 三 个 由 该 子 句 中 的 文字 做 标记 的 结 点 。 不 同 的 子 句 构件 采用 不 同 的 结 点 。 
证 明 这 种 归 约 满足 要 求 。) 


习题 选 解 
7.1 c 假 ; d a 
ha © H; d. 真 。 


7.28 首先 ， 可 以 在 多 项 式 时 间 内 验证 一 种 方案 是 否 有 效 ， 所 以 SOLITAIRE ENP, $W, WEH 3SAT<p 


7.37 


7.50 


SOLITAIRE。 给 定 一 个 565， 有 m NÆR 21, T2, t, Im Mk 个子 句 cl1，cz，…，ci， 构 造 一 个 
kXm 的 游戏 G。 假 定 $ 中 没有 子 句 同 时 含有 zx; 和 zi， 因 为 去 掉 这 种 子 句 不 会 影响 可 满足 性 。 

如 果 zi 在 子 句 cj 中 ， 就 放 一 枚 蓝 色 棋 子 在 cj 行 zx; 列 上 。 如 果 z; 在 子 句 c; 中 ， 就 放 一 枚 红色 
棋子 在 cj 行 x; 列 上 。 如 有 必要 ， 可 以 通过 复制 行 或 添加 空 列 使 棋盘 保持 正方 而 不 影响 可 解 性 。 可 
以 证 明 ，y 可 满足 当 且 仅 当 G 可 解 GRE). 

(>) E pE. n AH 〈 假 )， 从 相应 列 中 移 去 红色 KE) 棋子 。 现 在 ， 棋 子 对 应 着 取 
值 为 真 的 文字 。 因 为 所 有 子 句 都 有 一 个 取 值 为 真 的 文字 ， 所 以 所 有 行 都 有 棋子 。 

(<) 若 游 戏 可 解 (获胜 )。 如 果 某 列 中 的 红色 ( 蓝 色 ) 棋子 被 移 去 ， 将 相应 的 变量 置 为 真 
( 假 )。 每 行 都 有 棋子 留 下 ， 所 以 每 个 子 句 都 至 少 有 一 个 为 真 的 文字 。 因 此 p 被 满足 。 
假设 P=NP， 则 CLIQUEEP， 且 对 于 任意 的 &， 可 在 多 项 式 时 间 内 检测 G 是 否 有 一 个 三 团 。 一 一 
检测 G FEBA k 规模 的 团 , k 从 1 取 到 G 的 结 点 总 数 ， 就 可 以 在 多 项 式 时 间 内 找 出 G 中 最 大 团 
的 规模 1:1。 一旦 知道 了 +t， 就 可 按 下 述 方法 找 出 一 个 含有 t 个 结 点 的 团 。 对 GRDA, WET 
并 重新 计算 最 大 团 的 规模 。 如 果 规 模 减 小 了 ， 恢 复 x 继续 测试 下 一 个 结 点 。 所 有 结 点 都 这 样 处 理 
一 遍 后 ， 剩 下 的 结 点 就 是 要 求 的 上 团 。 

令 AE NP。 构 造 非 确 定型 图 灵机 M 在 非 确定 的 多 项 式 时 间 内 判定 A* 。 
M 一 “对 于 输入 w: 

1. 非 确定 地 将 w 分割 为 若干 片段 芭 王 Zi 2°. 

2. 对 每 一 zx;， 非 确定 地 猜测 可 证 明 r: EA 的 证 书 。 

3. 验证 所 有 可 能 的 证 书 ， 然 后 接受 。 

如 验证 失败 ， 则 拒绝 。” 

我 们 给 出 一 个 从 CLIQUE 到 HALF-CLIQUE 的 多 项 式 时 间 映 射 归 约 。 该 归 约 的 输入 是 CG, k) 
X BAFER (H) 作为 输出 ， 其 中 五 描述 如 下 。 若 G 有 和 ma 个 结 点 且 有 = 二 m/2， 则 H=G. # 
k<m/2, WH G 中 添加 7 FAR 〈 每 个 都 和 原 有 结 点 连接 且 彼 此 连接 ) 得 到 H, 其 中 jm k, 
这 样 H REA mtj=2m—2k 个 结 上 点。 显然，G 有 有 团 当 且 仅 当 互 AMRAk+j=m—k 的 团 。 
所 以 〈G,k)ECLIQUE H 4 (224 (H)€ HALF-CLIQUE. MR k>m/2, Wi G 中 添加 j 个 结 
点 但 不 添加 任何 边 得 到 态 ， 其 中 j= 二 2k 一 m。 这 样 卫 有 mm 十 j 二 2 个 结 点 ， 因 此 GA k- AHA 
H A kA. WMA (G,k) E CLIQUE HA“ (H) € HALF-CLIQUE。 还 需要 证 明 HALF 
CLIQUEENP。 证 书 很 简单 ， 就 是 那个 团 。 
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本 章 从 计算 问题 所 需要 的 空间 大 小 〈 存 储量 ) 出 发 考察 其 复杂 性 。 在 寻找 许多 计算 问 
题 的 可 行 解 时 ， 时 间 和 空间 是 最 重要 的 两 个 需要 衡量 的 因素 。 空 间 复 杂 性 与 时 间 复 杂 性 有 
许多 相似 之 处 ， 它 为 按照 计算 难度 来 更 深入 地 研究 问题 的 分 类 提供 了 男 外 一 种 方法 。 
与 分 析 时 间 复 杂 性 类 似 ， 首 先 需 要 选择 一 个 模型 来 度量 算法 所 消耗 的 空间 。 本 章 仍 采 
用 图 灵机 模型 ， 因 为 其 数学 形式 简单 ， 而 且 近 似 实 际 的 计算 机 ， 足 以 得 出 有 意义 的 结果 。 
令 M 是 一 个 在 所 有 输入 上 都 停机 的 确定 型 图 灵机 。M 的 空间 复杂 度 
(space complexity) 是 一 个 函数 f:N>N, 其 中 f(n) 是 M 在 任何 长 为 n 的 输入 上 扫描 带 
子 方 格 的 最 大 数 。 若 M 的 空间 复杂 度 为 fl(n)， 则 称 M 在 空间 fn) 内 运行 。 
如 果 MM 是 对 所 有 输入 在 所 有 分 支 上 都 停机 的 非 确定 型 图 灵机 ， 则 将 它 的 空间 复杂 度 
了 (nm) 定义 为 M 对 任何 长 为 nn 的 输入 ， 在 任何 计算 分 支 上 所 扫描 的 带子 方 格 的 最 大 数 。 
与 时 间 复 杂 度 类 似 ， 通常 用 渐 近 记 法 估计 图 灵机 的 空间 复杂 度 ，。 
A f:N>Rt 是 一 个 函数 。 空 间 复杂 性 类 (space complexity class) SPACE(f(n)) 
和 NSPACE(f(n)) 定义 如 下 ， 
SPACE(f(n))= 二 {LIL 是 被 O(f (n)) 空间 的 确定 型 图 灵机 判定 的 语言 } 
NSPACE( f(n)) ={L|L 是 被 O(f(n)) 空间 的 非 确 定型 图 灵机 判定 的 语言 } 
第 7 章 介 绍 了 NP 完全 问题 SAT， 现 在 证 明 用 线性 空间 算法 能 求解 SAT 问 
题 。 因 为 SAT 是 NP 完全 的 ， 所 以 SAT 不 能 用 多 项 式 时 间 算 法 求解 ， 更 不 能 用 线性 时 间 
算法 求解 。 因 为 空间 可 以 重用 ， 而 时 间 不 能 ， 所 以 空间 的 能 力 显 得 比 时 间 强 得 多 。 
Mi 二 “对 输入 (4$)，# 是 布尔 公式 ， 
1. 对 于 $ 中 变量 zis ,zm 的 每 个 真 值 赋值 ; 
2. 计算 y 在 该 真 值 赋 值 下 的 值 。 
3. BS MAL, WHE; 否则 拒绝 。” 
显然 机 器 Mi 是 在 线性 空间 内 运行 ， 因 为 每 一 次 循环 都 可 以 复 用 带子 上 的 同一 部 分 。 
该 机 器 只 需 存 储 当 前 的 真 值 赋值 ， 这 只 需要 消耗 Ol(m) 空间 。 因 为 变量 数 m 最 多 等 于 输 
和信 长度 2 ， 所 以 该 机 器 在 空间 O(n) 内 运行 。 ie 
这 个 例子 分 析 了 一 个 语言 的 非 确定 性 空间 复杂 性 。 在 下 一 节 将 说 明 ， 测 定 
非 确定 性 空间 复杂 性 ， 对 于 测定 它 的 确定 性 空间 复杂 性 是 有 很 大 帮助 的 。 下 面 分 析 判 定 一 
个 非 确定 型 有 穷 目 动机 是 否 接受 所 有 字符 串 的 问题 。 令 
ALLNFA = {(A) | A @—* NFA E L(A)= 3* } 
首先 给 出 一 个 非 确定 型 线性 空间 算法 来 判定 该 语言 的 补 ALLNFA 。 算 法 的 思想 是 利用 
非 确定 性 猜测 一 个 被 NFA 拒绝 的 字符 串 ， 然 后 用 线性 空间 跟踪 该 NFA， 看 它 在 特定 时 刻 
会 处 在 什么 状态 。 需 要 注意 的 是 ， 此 时 还 不 知道 该 语言 是 否 在 NP 或 coNP 中 。 
N= 二 “对 于 输入 (M), M 是 一 个 NFA: 
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1. 置 标记 于 NFA 的 起 始 状态 。 

2. 重复 执行 下 面 的 语句 2? 次 ， 这 里 g 是 M 的 状态 数 : 

3.” 非 确定 地 选择 一 个 输入 符号 并 移动 标记 到 M 的 相应 状态 ， 来 模拟 读 取 那个 符号 。 

4. WFR RR 2 和 3 表明 M 拒绝 某 些 字符 串 ， 即 如 果 在 某 一 时 刻 所 有 标记 都 不 落 
在 M 的 接受 状态 上 ， 则 接受 ; 否则 拒绝 。” 

如 果 M 拒绝 某 个 字符 串 ， 则 它 必 定 拒 绝 一 个 长 度 不 超过 2 的 字符 串 ， 因 为 在 任何 被 
拒绝 的 更 长 的 字符 串 中 ， 上 面 算法 中 所 描述 的 标记 的 位 置 分 布 必 定 重 复出 现 。 介 于 两 次 重 
复出 现 之 间 的 那 一 段 字 符 串 可 以 删 去 ， 从 而 得 到 更 短 的 被 拒绝 的 字符 串 。 所 以 六 可 判定 
ALLNFA 。 (值得 注意 的 是 ，N 也 接受 格式 错误 的 输入 。) 

该 算法 仅 需 要 的 空间 是 用 来 存放 标记 的 位 置 和 重复 计数 禹 ， 这 在 线性 空间 就 可 以 得 到 
解决 。 因 此 ， 该 算法 在 非 确定 的 空间 O(n) 内 运行 。 接 下 来 ,证明 一 个 关于 ALLNFA 的 确 
定性 空间 复杂 性 的 定理 。 = 


8.1 萨 维 奇 定理 


本 节 介 绍 有 关 空 间 复 杂 性 的 最 早 结 论 之 一 一 一 蔷 维 奇 定理 。 该 定理 表明 确定 型 机 器 可 
以 用 非常 少 的 空间 模拟 非 确定 型 机 器 。 ed 
时 间 。 对 于 空间 复杂 性 ， 萨 维 奇 定理 说 明 ， 任 何 消耗 f(n) 空间 的 非 确 定型 图 灵机 都 可 以 
转变 为 仅 消耗 £2 (n) 空间 的 确定 型 图 灵机 。 

( 萨 维 奇 定理 ) 对 于 任何 日 函数 f: NR, AP fmn, 

NSPACE( f(n)) CS SPACE( f? (n)) 

证 明 思 路 ”我 们 需要 确定 地 模拟 一 个 f(n) 空间 的 NTM ( 非 确定 型 图 灵机 )。 最 简单 
的 方法 就 是 逐个 地 尝试 NTM 的 所 有 计算 分 支 。 这 种 模拟 要 求 记 录 当 前 正在 尝试 的 是 哪 
一 个 分 支 ， 以 便 能 够 过 渡 到 下 一 个 分 支 。 但 是 消耗 f(n) 空间 的 一 个 分 支 可 能 运行 
224f2) 步 ， 每 一 步 都 可 能 是 非 确 定 的 选择 。 顺 序 地 考察 每 一 个 分 支 要 求 记 录 某 个 具体 
分 支 上 所 做 的 所 有 选择 ， 以 便 能 找到 下 一 个 分 支 。 所 以 该 方法 可 能 会 用 掉 227'2 空间 ， 
超过 了 Ow) 空间 。 

考虑 到 更 具 一 般 性 的 问题 ， 这 里 采用 了 另 一 种 不 同 的 方法 。 给 定 NTM 的 两 个 格局 cl 
和 co 以 及 一 个 整数 :， 要 求 判定 该 NTM EBE t HANNAS) 空间 从 cl 变 到 co, MR 
问题 为 可 产生 性 问题 (yieldability problem). WRS cl 是 起 始 格局 ，c* 是 接受 格局 ， 上 是 
非 确 定型 机 器 可 以 使 用 的 最 大 步 数 ， 那 么 通过 求解 可 产生 性 问题 ， 就 能 够 判定 机 器 是 否 接 
受 输入 。 

下 面 给 出 一 个 确定 的 递归 算法 来 求解 可 产生 性 问题 。 它 的 运算 过 程 为 : 寻找 一 个 中 间 
格局 Cm ， 递 归 地 检查 cl 能 否 在 t/2 步 内 到 达 cn, WR cm 能 否 在 /2 步 内 到 达 cs ERIE 
用 两 次 递归 检查 的 空间 即 可 显著 地 节省 空间 开销 。 

该 算法 需要 用 来 存储 递归 栈 的 空间 。 递 归 的 每 一 层 需要 O(f(n)) 空间 来 存储 一 
局 。 递 归 的 深度 是 logt， 这 里 t 是 非 确 定型 机 器 在 所 有 分 支 上 可 能 消耗 的 最 大 时 间 。 因 为 
t=20U™) | AFL logt 二 O(f(n))。 因 此 确定 的 模拟 过 程 需要 OCS? (n)) 空间 。 





日 在 8.4 节 ， 我 们 证 明 只 要 f(n) 宇 logn， 萨 维 奇 定理 就 能 成 立 。 
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证 明 设 六 是 在 空间 f(r) 内 判定 语言 A 的 NTM。 构造 一 个 判定 A 的 确定 型 图 灵机 
M。 机 器 M 使 用 过 程 CANYIELD， 该 过 程 检查 N 的 一 个 格局 能 否 在 指定 的 步 数 内 产生 男 
一 个 格局 ， 它 求解 了 在 证 明 思 路 中 所 描述 的 可 产生 性 问题 。 

设 忆 是 输入 到 N 的 字符 串 。 对 于 六 的 格局 c1 ,cz 以 及 整数 上 (为 方便 ， 假 定 上 是 2 的 
BRK), ， 如 果 从 格局 cl 出 发 ，N 有 一 系列 非 确 定 的 选择 能 使 它 在 上 步 内 进入 格局 c2， 
WW CANYIELD(ci ,cz ,t) 输出 接受 ， 否则 ，CANYIELD 输出 拒绝 。 

CANYIELD 王 “对 输入 cl co Alt: 

l. Æ 疆 1， 则 直接 检查 是 否 有 a=, RARE N 的 规则 检查 cl 能 否 在 一 步 内 
产生 cs 。 如 果 其 中 之 一 成 立 ， 则 接受 ; 如 果 两 种 情况 都 不 成 立 ， 则 拒绝 。 
2. @t>1, WIN 的 每 一 个 消耗 空间 f(r) 的 格局 cm: 


3， 运行 CANYIELD (a ss 7) 
4. 运行 CANYIELD(cm sts S] i 


5. AR 3 步 和 第 4 步 都 接受 ， 则 接受 。 
6. 知 此 时 还 没有 接受 出 拒绝 
现在 定义 M 来 模拟 N 。 首先 修改 N， 当 它 接受 时 ， 把 带子 清空 并 把 读 写 头 移 到 最 左 
边 的 单元 ， 从 而 进入 称 为 caccept 的 格局 。 令 csar 是 N Æw 上 的 起 始 格 局 。 选 一 个 常数 d， 
使 得 N 在 f(n) 带子 上 的 格局 数 不 超 过 24”, Ep n Ew 的 长 度 。2” ”是 NN 在 所 有 分 
支 上 的 运行 时 间 的 上 界 。 
M 一 “对 输入 w: 
1. 输出 GANYIELD CCotart »Caccept 927°” ) HU SEE.” 
算法 CANYIELD 显然 求解 了 可 产生 性 问题 。 因 此 M 正确 地 模拟 了 N。 下 面 需 要 分 析 
M, WE OCP (™)) 空间 内 运行 。 
CANYIELD 在 递归 调用 自己 时 ， 它 把 所 处 的 步骤 号 以 及 cl co At 的 值 都 存储 在 栈 
中 ， 所 以 递归 调用 返回 时 能 够 恢复 这 些 值 。 因 此 在 递归 的 每 一 层 需要 增加 OC f(n)) 空间 。 
此 外 ;递归 的 每 一 层 把 t 的 值 减 小 一 半 。 开 始 时 t 等 于 224， 所 以 递归 的 深度 是 
O(log24™ ) 或 OC(f(n))。 因 此 总 共 消 耗 的 空间 是 OC? (n))， 正 如 断言 所 述 。 
在 这 个 论证 过 程 中 产生 了 一 个 技术 难点 ， 其 原因 是 算法 M 在 调用 CANYIELD 时 需 
要 知道 f(n) 的 值 。 修 改 M 可 以 克服 这 个 困难 ， 方 法 是 对 fl(n) 不 断 赋值 使 fn) 三 1,2， 
3,… 。 对 于 每 个 值 f(n) 二:， 修 改 后 的 算法 利用 GANYIELD 来 确定 接受 格局 是 否 可 达 。 
此 外 ， 利 用 该 过 程 ， 还 可 通过 检查 N 能 否 从 起 始 格局 出 发 到 达 某 个 长 度 为 ?十 1 的 格局 来 
确定 N 是 否 至 少 需 要 i 十 1 大 小 空间 。 如 果 接 受 格局 可 达 ， 则 M 接受 ; 如果 没有 长 为 ;十 ] 
的 格局 可 达 ，M 拒绝 ; 否则 M 继续 尝试 f(n)==i 十 1。( 也 可 以 用 另 一 种 办 法 来 克服 这 个 困 
难 ， 即 假定 M 能 在 空间 OC(f(n))〉 内 计算 出 f), 但 是 那样 就 需要 把 这 个 假定 加 入 定理 的 
陈述 中 。) è 


8.2 PSPACE 类 


RA T ER 我 们 为 空间 复杂 性 定义 PSPACE 类 。 
PSPACE 是 在 确定 型 图 灵机 上 、 在 多 项 式 空间 内 可 判定 的 语言 类 。 换 言 之 ， 


BEF ZEA ZZi 211 


PSPACE =U SPACE(n*) 
k 


PSPACE 类 的 非 确定 型 版 本 NPSPACE 可 以 类 似 地 用 NSPACE 类 来 定义 。 然 而 ， 任 
何 多 项 式 的 平方 仍 是 多 项 式 ， 根 据 萨 维 奇 定 理 ，NPSPACE 王 PSPACE。 

在 例 8.3 和 例 8.4 中， 已 经 说 明了 SAT 属于 SPACE(n), ALLyra lB coNSPACE(n), 
而 根据 萨 维 奇 定理 ， 确 定型 空间 复杂 性 类 对 补 运 算 封 闭 ， 所 以 ALLNFA 也 属于 SPACE). 
因此 SAT 和 ALLNFA 这 两 个 语言 都 在 PSPACE 中 。 

现在 考察 PSPACE 与 P 和 NP 的 关系 。 显 而 易 见 ，PCPSPACE， 因 为 运行 快 的 机 器 
不 可 能 消耗 大 量 的 空间 。 更 精确 地 说 ， 当 tnn 时 ， 由 于 在 每 个 计算 步 上 最 多 能 访问 一 
个 新 单元 ， 因 此 ， 任 何在 时 间 t(n) 内 运行 的 机 咽 最 多 能 消耗 tO) 的 空间 。 与 此 类 似 ， 
NEPENPSPACE， 所 以 NPEPSPACE。 

反 过 来 ， 根 据 图 灵机 的 空间 复杂 性 也 可 以 界定 它 的 时 间 复 杂 性 。 对 于 f(n) 宇 rn， 通过 
简单 推广 引 理 5. 7 的 证 明 可 知 ， 一 个 消耗 f(n) 空间 的 图 灵机 至 多 有 m22 AA 
格局 ， 图 灵机 的 停机 计算 不 能 出 现 重 复 格局 。 因 此 消耗 空间 f(n) 的 图 灵机 S 必定 在 时 间 
f(n)20UM) 内 运行 ， 得 出 PSPACECEXPTIME= U, TIME(2” ) 。 

用 下 面 的 一 系列 包含 式 总 结 迄 今 为 止 所 定义 的 复杂 性 类 之 间 的 关系 : 

P C NPC PSPACE = NPSPACE C EXPTIME 

在 这 些 包含 式 中 ， 还 不 知道 是 否 有 某 一 
个 为 等 式 。 也 许 有 人 会 发 现 一 个 类 萨 维 奇 定 
理 的 方法 ， 使 得 这 里 的 某 些 类 能 够 合并 为 一 
个 类 。 但 是 在 第 9 章 将 证 明 PA EXPTIME, NE 
所 以 上 面 的 包含 式 中 至 少 有 一 个 是 真 包含 ， 但 © 
还 不 能 确定 是 哪 一 个 ! 实际 上 ， 大 部 分 研究 者 
相信 所 有 包含 式 都 是 真 包 含 。 图 8- 1 描绘 了 这 
些 类 之 间 的 关系 ， 假 设 所 有 类 是 不 同 的 。 图 8-1 P, NP, PSPACE 和 EXPTIME 的 推测 关系 







EXPTIME 
PSPACE 


8.3 PSPACE 完全 性 


7.4 节 介 绍 了 NP 完全 语言 类 ， 它 代表 NP 中 最 难 的 语言 类 。 证 明 一 个 语言 是 NP E 
全 的 是 说 明 它 不 属于 了 的 强 有 力 的 证 据 。 若 它 属 于 P， 则 了 将 和 NP 相等 。 本 节 为 
PSPACE 类 引入 一 个 类 似 概念 PSPACE 完全 性 。 

若 语 言 B 满足 下 面 两 个 条 件 ， 则 它 是 PSPACE 完全 的 : 

1. B 属于 PSPACE, 

2. PSPACE 中 的 每 一 个 语言 A 多 项 式 时 间 可 归 约 到 B。 

若 B 只 满足 条 件 2， 则 称 它 为 PSPACE HEB. 

在 定义 PSPACE 完全 性 时 ， 利 用 了 定义 7. 24 中 给 出 的 多 项 式 时 间 可 归 约 性 。 为 什么 
不 定义 并 且 采 用 多 项 式 空 间 可 归 约 性 ， 而 用 多 项 式 时 间 可 归 约 性 呢 ? 为 了 理解 这 个 重要 问 
题 的 答案 ， 首 先 考察 定义 完全 问题 的 动机 。 

完全 问题 是 重要 的 ， 因 为 它们 是 复杂 性 类 中 最 困难 问题 的 样 例 。 完 全 问题 是 最 难 的 ， 


O 当 8.4 节 介绍 消耗 亚 线性 空间 的 图 灵机 时 ， 这 里 的 要 求 fd >n 被 推广 为 f(n) 之 log n. 


因为 该 类 中 的 其 他 问题 很 容易 归 约 到 它 。 如 果 找 到 一 种 简便 的 方法 求解 完全 问题 ， 就 能 很 
容易 求解 该 类 中 的 其 他 所 有 问题 。 为 了 使 这 种 逻辑 能 够 成 立 ， 相 对 于 该 类 中 典型 问题 的 复 
杂 性 ， 归 约 过 程 就 必须 是 容易 的 。 如 果 归 约 过 程 本 吴 就 很 难 算 ， 那 么 针对 完全 问题 的 容易 
解法 就 不 一 定 能 推导 出 其 他 归 约 到 它 的 问题 的 容易 的 解法 。 

所 以 ， 必 须 遵 循 如 下 规则 当 为 一 个 复杂 性 类 定义 完全 问题 时 ， 归 约 的 模型 必须 比 用 
来 定义 类 本 壬 的 模型 更 加 受 限 。 


8.3.1 TQBF 问题 


PSPACE 完全 问题 的 第 一 个 例子 是 可 满足 性 问题 的 推广 。 回 忆 一 下 ， 布尔 公式 是 一 个 
包含 布尔 变量 、 常 数 0 和 1 以 及 布尔 运算 符 人 ，V， 一 的 表达 式 。 现 在 定义 更 一 般 形式 的 
A AR SK 

量词 (quantifier) Y (对 所 有 ) MAGE) Efrem HAA hM. AAV 的 含义 
是 ， 对 于 变量 z 的 每 个 什 ， 语 句 % WER. XM, WA Jre 的 含义 是 ， 对 于 变量 z 的 
EME. A p 是 真 。 有 了 时， 把 VY 称 为 全 称 量词 (universal quantifier)， 把 3 称 为 存在 量 
ial (existential quantifier) ， 紧 跟 在 量词 后 面 的 变量 x 受到 该 量词 约束 (bound), 

例如 ， 对 于 目 然 数 ， 语 句 YVzLz 十 1 六 zj] 的 含义 是 : 每 一 个 自然 数 r 的 后 继 z 十 1 都 
比 它 大 。 显 然 这 个 命题 为 真 。 然 而 ,语句 yLy 十 y 二 3」 显然 是 假 的 。 当 解释 包含 量词 的 
语句 的 含义 时 ， 必 须 考虑 所 取 值 的 域 (universe) 。 在 这 个 例子 中 ， 域 是 自然 数 ， 但 是 如 果 
改 用 实数 ， 则 带 存 在 量词 的 语句 就 变 成 真 的 了 。 

语句 可 以 包含 多 个 量词 ， 如 Yz3yLy>zj。 对 于 自然数 域 ， 该 语句 的 语义 是 每 一 个 
自然 数 都 有 另 一 个 目 然 数 比 它 大 。 量 词 的 次 序 很 重要 。 符 颠倒 次 序 ， 如 语句 了 >yVzLy> 
zj， 则 给 出 完全 不 同 的 含义 ， 即 存在 某 个 自然 数 比 所 有 其 他 数 都 大 。 显 然 ， 第 一 个 语句 为 
真 ， 第 二 个 语句 为 假 。 

量词 可 以 出 现在 数学 语句 中 的 任何 地 方 。 它 的 作用 范围 是 跟 在 量化 变量 后 的 一 对 匹配 
的 括 弧 内 出 现 的 语句 段 。 该 段 称 为 量词 的 辖 域 (scope) 。 通 稍 ， 要 求 所 有 变量 都 出 现在 语 
句 的 开头 会 很 方便 ， 这 时 每 个 量词 的 辖 域 就 是 其 后 的 所 有 语句 成 分 。 这 种 语句 称 为 前 束 范 
xt (prenex normal form)。 很 容易 把 任何 语句 都 写成 前 束 范式 。 如 不 特别 指明 ， 只 考虑 这 
种 形式 的 语句 。 

市 量词 的 布尔 公式 称 为 量词 化 布尔 公式 (quantified Boolean formula), X Fix AP? 
KK, WE {0,1}. Bilan: 

d= Vrdisl@vVvwaAGgvy) 
是 量词 化 布尔 公式 。 这 里 ，# HA. (ERA Ve MI y 的 次 序 ， 就 变 成 假 了 。 

如 果 公 式 的 每 个 变量 都 出 现在 某 一 量词 的 辖 域内 ， 该 公式 就 称 为 全 量词 化 的 〈fully 
quantified) 。 全 量词 化 的 布尔 公式 有 时 称 为 句子 (sentence)， 它 要 么 是 真 ， 要么 是 假 。 例 
如 ， 前 面 的 公式 $ 是 全 量词 化 的 。 但 是 ， 如 果 删 去 上 的 开头 部 分 Vz， 该 公式 就 不 再 是 全 
量词 化 的 。 它 既 不 是 真 ， 也 不 是 假 。 

TQBF 问题 就 是 要 判定 一 个 全 量词 化 的 布尔 公式 是 真 还 是 假 。 定 义 语言 

TQBF = (1《8) | p 是 真 的 全 量词 化 的 布尔 公式 ) 

TQBF 是 PSPACE 完全 的 。 
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证 明 思 路 ”为 了 证 明 TQBF 属于 PSPACE， 给 出 一 个 简单 的 算法 。 该 算法 首先 给 变 
量 赋 值 ， 然 后 递归 地 计算 公式 在 这 些 值 下 的 真 值 。 从 这 些 信 息 中 ， 算 法 就 能 确定 原 量词 化 
公式 的 真 值 。 

为 了 证 明 PSPACE 中 的 每 个 语言 A 在 多 项 式 时 间 内 可 归 约 到 TQBF， 从 判定 A 的 多 
项 式 空间 界限 图 灵机 开始 ， 然 后 给 出 多 项 式 时 间 归 约 ， 它 把 一 个 字符 串 映 射 为 一 个 量词 化 
的 布尔 公式 po p 模拟 机 器 对 这 个 输入 的 计算 。 公 式 为 真 当 且 仅 当 机 器 接受 。 

作为 这 一 构造 的 首次 尝试 ， 模 仿 库 克 - 列 文 定理 的 证 明 思 路 ， 即 定理 7.22。 可 以 构造 
公式 $6， 通过 描绘 接受 画面 来 模拟 M 在 输入 w 上 的 计算 。M 在 w 上 的 画面 宽度 是 O(n*)， 
BI M 消耗 的 空间 。 因 为 M 可 能 运行 指数 长 的 时 间 ， 所 以 它 的 高 度 是 mn* 的 指数 。 因 此 ， 如 
果 直 接 用 公式 表示 画面 ， 就 可 能 导致 指数 长 的 公式 。 然 而 ， 多 项 式 归 约 不 能 产生 指数 长 的 
结果 ， 所 以 这 种 尝试 不 能 证 明 A<p TQBF. 

下 面 改 用 一 种 与 院 维 奇 定理 的 证 明 相 关 的 技术 来 构造 公式 。 该 公式 把 画面 分 成 两 半 ， 
利用 全 称 量词 的 功能 ， 用 公式 的 同一 部 分 来 代表 每 一 半 。 结 果 产 生 短 得 多 的 公式 。 

证 明 首先 ， 给 出 一 个 判定 TQBF 的 多 项 式 空间 算法 : 

T=" 对 输入 《8,5 是 一 个 全 量词 化 布尔 公式 : 

L. 看 不 含量 词 ， 则 它 是 一 个 只 有 常数 的 表达 式 。 计 算 SM. AAR, Me 
受 ; 否则 拒绝 。 

2. 右 8 等 于 zw， 在 兴 上 递归 地 调用 工 ， 首 先 用 0 替换 z+， 然后 用 1 替换 z+。 只 
要 有 一 个 结果 是 接受 ， 则 接受 ; 否则 拒绝 。 

3. HS SV ed. 在 y 上 递归 地 调用 人， 首先 用 0 替换 zx， 然后 用 1 替换 x。 若 两 
个 结果 都 是 接受 ， 则 接受 ; 否则 拒绝 。” 

算法 本 显然 判定 TQBF。 为 了 分 析 它 的 空间 复杂 性 ， 我 们 发 现 它 递归 的 深度 最 多 等 于 
变量 的 个 数 。 在 每 一 层 只 需 存储 一 个 变量 的 值 ， 所 以 空间 总 消耗 是 Om), Hit m Æ g 中 
出 现 的 变量 的 个 数 。 因 此 工 在 线性 空间 内 运行 。 

接 下 来 ， 证明 TQBF 是 PSPACE 难 的 。 设 A 是 一 个 由 图 灵机 M Æ nt 空间 内 判定 的 
语言 ，& 是 某 个 常数 。 下 面 给 出 一 个 从 A 到 TQBF 的 多 项 式 时 间 归 约 。 

该 归 约 把 字符 串 w 映射 为 一 个 量词 化 的 布尔 公式 上 。$ 为 真 当 且 仅 当 M 接受 w。 为 了 
说 明 怎 样 构造 $4， 需 解 决 一 个 更 一 般 的 问题 。 利 用 两 个 代表 格局 的 变量 集合 a 和 cz 及 一 
个 数 :二 0， 构 造 一 个 公式 poneo WRH cl 和 cz 赋 为 实际 的 格局 ， 则 该 公式 为 真 当 且 仅 
当 M 能 够 在 最 多 :t 步 内 从 cl Mike. Rea, TAS p 是 公式 $8。 ,cw， 其 中 hh 二 2%%™， 
d 是 一 个 选取 的 常数 ， 使 得 M 在 长 为 n 的 输入 上 可 能 的 格局 数 不 超 过 24  ”。 这 里 ， 令 
fm=n*, ATA, ice ee 2 WE. 

类 似 库 克 - 列 文 定理 的 证 明 ， 该 公式 对 格局 单元 的 内 容 进 行 了 编码 。 对 应 于 单元 的 可 
能 设置 ， 每 个 单元 有 几 个 相关 的 变量 ， 每 个 带子 符号 和 状态 都 有 一 个 变量 对 应 。 每 个 格局 
有 nt 个 单元 ， 所 以 用 O(n*) 个 变量 编码 。 

A 夺 1， 则 容易 构造 y. ,。,:。 设 计 公 式 ， 使 之 表达 要 人 么 cl 等 于 cs ， 要 么 cl 能 在 M 的 
一 步 内 变 到 cz 。 为 了 表达 相等 性 ， 使 用 一 个 布尔 表达 式 来 表示 : 代表 cl 的 每 一 个 变量 与 
代表 co 的 相应 变量 包含 同样 的 布尔 值 。 为 表达 第 二 种 可 能 性 ， 利 用 库 克 - 列 文 定 理 的 证 
明 技 巧 ， 构 造 布 尔 表 达 式 表示 ， 代 表 cl 的 每 个 三 元 组 的 值 能 正确 地 产生 相应 的 cz 的 三 元 
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组 的 值 ， 从 而 就 能 够 表达 cl FE M 的 一 步 内 产生 c2。 
a t>1, BU WAG % ,。,:。 作 为 预演 ， 先 尝试 一 种 不 太 好 的 想法 ， 然 后 再 修正 
E: = 
$e, sept = Amilge,.m,.¢ N pmst] 
符号 m 表示 M 的 一 个 格局 。3m1 是 3x1,，… ,zi 的 缩写 ， HP LSO), E 
对 mi 编码 的 变量 。 所 以 bo, ,的 这 个 构造 的 含义 是 :如 果 存在 某 个 中 间 格 局 m1， 使 得 M 


在 至 多 本 步 内 从 ci 变 到 m, HEEEL HAA m 变 到 c, WAM 就 能 在 至 多 1 步 内 


从 cl 变 到 cs 。 然 后 再 递归 地 构造 fc, ,m ,和 pm,c ,这 两 个 公式 。 

公式 $c. :具有 正确 值 。 换 言 之 ， 只 要 M 能 在 上 SAM 变 到 cx ， 它 就 是 TRUE. 
然而 ， 它 太 长 了 。 构 造 过程 中 涉及 的 递归 的 每 一 层 都 把 上 的 值 减 小 一 半 ， 但 却 把 公式 的 长 
度 增加 了 大 约 一 倍 ， 最 后 导致 公式 的 长 度 大 约 是 +。 开始 时 二 2awcoo ， 所 以 这 种 方法 给 出 
的 公式 是 指数 长 的 。 

为 了 缩短 公式 的 长 度 ， 除 了 使 用 3 量词 以 外 ， 再 利用 V 量词 。 令 

Pe, ci = 4m V (c35c4) € { Cer 571) 5 (my 52) } [ bc, nes J 

新 引入 的 变量 代表 格局 cs Aca, ERUPT FAR “HE” H—-TRFASH, mi 
保持 原来 的 意思 。 通 过 写成 VY (c3,c4)E{(c,mi),(mi,cz))， 就 指明 了 代表 格局 ck Mca 
的 变量 可 以 分 别 取 cl 和 mi 的 变量 的 值 ， 或 者 m 和 cz 的 变量 的 值 ， 结 果 公式 get EM 
种 情况 下 都 为 真 。 可 以 把 结构 VzE{y,z}[…] 替换 为 等 价 的 结构 Vz[(Cz 一 yVz 一 z) 一 …]， 
从 而 得 到 语法 正确 的 量词 化 布尔 公式 。 回 忆 第 0 章 的 内 容 ， 在 0. 2 节 中 证 明了 布尔 蕴涵 
(>) 和 布尔 相等 (=) 可 以 用 AND 和 NOT 来 表达 。 这 里 ， 为 了 表达 的 清晰 ， 使 用 符 
号 = 表示 布尔 相等 ， 而 没 使 用 等 价 符号 <>。 

为 了 计算 公式 $。,。 na KE, Bop = 20 ， 注 意 到 递归 每 一 层 增加 的 那 部 分 公式 
的 长 度 与 格局 的 长 度 呈 线性 关系 ， 所 以 长 度 是 OCf(z))。 递 归 的 层 数 是 log(2do2 ) ROU). 
所 以 所 得 到 的 公式 的 长 度 是 OCf? (n))。 J 


8.3.2 博弈 的 必 胜 策略 


本 书 中 ， 把 博弈 (game) 不 严格 地 定义 为 两 个 对 立方 的 竞赛 ， 每 一 方 都 按照 预先 确定 
的 规则 争取 达到 某 一 目标 。 博 弈 有 多 种 形式 ， 从 国际 象棋 这 一 类 棋盘 博弈 ， 到 作为 协作 或 
者 社会 冲突 模型 的 经 济 和 战争 博弈 等 。 

博弈 和 量词 紧密 相关 。 一 个 量化 的 语句 存在 一 个 之 对 应 的 博弈 ; 反之 ,一 个 博弈 也 常 
存在 一 个 对 应 的 量化 语句 。 这 种 对 应 关系 在 以 下 几 个 方面 是 有 用 的 。 首 先 ， 把 一 个 包含 许 
多 量词 的 数学 语句 用 对 应 的 博弈 表达 出 来 ， 可 以 洞悉 该 语句 的 含义 。 其 次 ， 把 一 个 博弈 用 
量化 语句 表达 出 来 有 助 于 理解 该 博弈 的 复杂 性 。 为 了 阐明 博弈 与 量词 之 间 的 对 应 关系 ， 本 
节 描 述 了 一 种 称 为 公式 博弈 (formula game) 的 人 工 博 弈 。 

设 % 王 3zlY zz 3zs…Q rilo] 是 一 个 前 束 范式 的 量词 化 布尔 公式 ， 这 里 Q 代表 量词 
VI. Re 与 下 面 的 博弈 相关 联 。 两 名 选手 称 为 选手 A 和 选手 下 ， 轮 流 为 变量 zl,，…， 
ce 选 值 。 选 手 A 为 那些 VY 量词 约束 的 变量 选 值 ， 选 手下 为 那些 3 量词 约束 的 变量 选 值 。 进 
行 的 顺序 与 公式 开头 量词 出 现 的 顺序 相同 。 在 游戏 结束 时 ， 利 用 选手 给 变量 挑选 的 值 宣布 
结果 。 如 果 y〈 即 删 去 量词 后 的 那 部 分 公式 ) 此 时 是 TRUE, WEFEMs 如 果 y 此 时 是 
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FALSE, MHF A M- 
UREP iz $1 是 公式 
村 Yas Azs Grr V oe) A Gee V oe) A C V sD] 
在 p WARR H, HEF E 挑选 zl WE, AF A 挑选 r WE, RAAF E 挑选 zs 
的 值 。 

举 一 个 该 博弈 游戏 过 程 的 例子 。 照 例 ， 用 1 表示 布尔 值 TRUE， 用 0 表示 FALSE, 
WAF ERB zi 二 1， 然 后 选手 A 挑选 xz 二 0， 最 后 选手 下 挑选 x3 二 1。 当 ri, x2: M z 
取 这 些 值 时 ， 子 公式 (iVar) Alr: Vz) AVT) Æl, MUF EM. ML. 
FE BWW max Wiese, RECHE zl 二 1， 然 后 不 论 选 手 A r HAA, ERMA 
x3 选 与 zz 相反 的 值 。 我 们 称 选 手下 有 这 场 博弈 的 必 胜 策 略 (winning strategy)。 如 果 双 
方 都 下 出 最 佳 步骤 时 ， 某 个 选手 能 赢 ， 则 该 选手 有 该 博弈 的 必 胜 策略 。 

现在 稍微 修改 一 下 公式 ， 得 到 一 个 博弈 ， 使 得 选手 A 有 必 胜 策略 。 设 % 是 公式 

Jai Va das (ri V x2) A Cta V x3) A Ce: V 23) J 
现在 选手 A 有 必 胜 策略 ， 因 为 不 论 选手 玉 为 zl HAA, HFA 可 以 选 zz 王 0， 从 而 使 
量词 后 面 出 现 的 那 部 分 公式 为 假 ， 而 不 论 选 手下 在 最 后 一 步 选 什么 值 。 a 
下 面 考虑 判定 在 与 某 个 具体 的 公式 相关 联 的 公式 博弈 中 哪 一 方 有 必 胜 策略 的 问题 。 令 
FORMULA-GAME = {(8) | 在 与 $ 相关 联 的 公式 博弈 中 选手 玉 有 必 胜 策略 ) 

FORMULA-GAME 是 PSPACE 完全 的 。 

证 明 思 路 FORMULA-GAME 是 PSPACE 完全 的 ， 理 由 很 简单 ， 即 它 和 TQBF 是 
一 样 的。 为 了 看 出 FORMULA-GAME =TQBF， 注 意 到 一 个 公式 恰好 当选 手下 在 相关 联 
的 公式 博弈 中 有 必 胜 策略 时 为 TRUE ， 因 为 两 种 情况 有 同样 的 含义 。 

证 明 公式 $= 二 3zx1Y zz 3zs…[L0 是 TRUE 的 条 件 是 : 存在 zi 的 某 种 赋值 ， 使 得 
对 于 zsz 的 任意 赋值 ， 存 在 zs 的 某 种 赋值 ， 使 得 ……， 等 等 ， 其 中 y 在 这 些 变 量 的 赋值 下 
为 TRUE。 类 似 地 ， 选 手 王 在 与 点 关联 的 博弈 中 有 必 胜 策 略 的 条 件 是 : 选手 下 可 以 给 zl 
赋 某 个 值 ， 使 得 对 于 zz 的 任意 赋值 ， 选 手下 可 以 给 zs 赋 一 个 值 ， 使 得 …… ， 等 等 ， 其 中 
y 在 变量 的 这 些 赋值 下 为 TRUE, 

当 公 式 不 存在 量词 与 全 称 量词 之 间 交 蔡 时 ， 同 样 的 推理 也 能 成 立 。 如 果 A 的 形式 为 
V Ti ,XT2 ,ZX3 J Xx4,X5 Y zelo], AF A 在 公式 博弈 中 走 头 三 步 ， 给 rir: 和 zs 赋值 ; 然后 
AF EEA, A r, 和 zs 赋值 ; 最 后 选手 A 给 ze 赋 一 个 值 。 

Ault, ¢€ TQBF 恰好 当 ¢€ FORMULA-GAME 时 成 立 ， 由 定理 8.8, KERZ. m 


8.3.3 ”广义 地 理学 


既然 知道 公式 博弈 是 PSPACE 完全 的 ， 就 能 更 容易 地 证 明 某 些 其 他 博弈 的 PSPACE 
完全 性 或 PSPACE 难 解 性 。 本 小 节 从 地 理学 游戏 的 推广 开始 ， 然 后 讨论 如 国际 象棋 、 跳 
棋 和 GO 这 样 的 博弈 。 

地 理学 是 一 种 儿童 游戏 ， 选 手 们 轮流 给 世界 各 地 的 城市 命名 。 每 一 座 选 中 的 城市 的 首 
字母 必须 与 前 一 座 城市 的 尾 字母 相同 ， 不 允许 重复 。 游 戏 从 某 个 指定 的 城市 开始 ， 以 茶 一 
方 因 无 法 延续 而 认输 为 止 。 例 如 ， 如 果 游 戏 从 Peoria 开始 ， 那 么 下 面 可 以 跟 Amherst (Al 
为 Peoria $ E FZ HÆ a, mM Amherst 的 首 字 母 也 是 a)， 然 后 可 以 是 Tucson, ARH 


Nashua， 等 等 ， 直 到 一 方 被 难 倒 并 输 掉 比赛 为 止 。 

可 以 用 有 回 图 作为 该 游戏 的 模型 ， 图 中 的 结 点 是 世界 各 地 的 城市 。 根 据 游 戏 规则 ， 如 
采 一 座 城市 可 以 导 回 另 一 座 城市 ， 则 从 前 一 座 城 市 到 后 一 座 城市 画 一 个 箭头 。 换 言 之 ， 如 
采 城 市 X 的 尾 字 母 与 城市 Y 的 首 字母 相同 ， 则 图 中 就 包含 一 条 从 城市 X 到 城市 Y 的 边 。 
8-2 中 展示 了 一 部 分 地 理学 图 。 





图 8-2 代表 地 理学 游戏 的 部 分 图 


当地 理学 规则 翻译 为 这 种 图 表示 法 时 ， 一 名 选手 从 指定 的 起 始 结 点 开始 ， 然 后 选手 们 
交 蔡 地 挑选 结 点 ， 形 成 图 中 的 一 条 简单 路 径 〈 即 每 个 结 点 只 能 用 一 次 ， 对 应 于 要 求 城市 不 
能 重复 ) 。 第 一 个 不 能 扩展 路 径 的 选手 输 掉 比赛 。 

在 广义 地 理学 (generalized geography) 中 ， 用 任意 的 
带 有 指定 起 始 结 点 的 有 向 图 代替 了 与 实际 城市 相关 联 的 
图 。 例如， 图 8- 3 是 一 个 广义 地 理学 游戏 的 例子 。 

KEF IZE., FIERE. EZA, FIA 
如 下 的 必 胜 策略 。 选 手工 从 结 点 1， 即 指定 的 起 始 结 点 开 
始 。 结 点 1 只 能 指向 结 点 2 和 3， 所 以 选手 工 的 第 一 步 必 
须 是 这 两 种 选择 之 一 。 他 选 3。 现 在 轮 到 选手 了 [ 走 了 ,但 
结 点 3 仅 指 回 结 点 5， 所 以 她 被 迫 选择 结 点 5。 然 后 选手 I 从 6、7、8 中 选择 6。 现 在 选手 
[必须 从 结 点 6 出 发 ,但 是 它 仅 指 向 结 点 3， 而 3 在 前 面 已 经 走 过 了 。 选 手 了 [被 困 住 了 ， 
于 是 选手 工 赢 。 

MAMTA, MAA 3 和 6 之 间 边 的 方向 ， 则 选手 有 必 胜 策略 。 你 能 看 出 
KE? 如 果 选 手工 像 以 前 一 样 出 发 到 结 点 3， 则 选手 [以 结 点 6 为 应 手 ， 立 即 赢得 比赛 ， 
所 以 选手 工 唯一 的 希望 是 到 结 点 2。 但 在 这 种 情况 下 ， 选 手 开 以 4 为 应 手 。 如 果 选 手工 现 
在 取 5， 则 选手 开 取 6 Rm. MRF LR 7, WFR ORM. TCM 1 EAE, 
选手 工 总 能 赢 ， 所 以 选手 开 有 必 胜 策略 。 

判定 在 广义 地 理学 游戏 中 哪 一 方 有 必 胜 策略 的 问题 是 PSPACE 完全 的 。 令 

GG 一人 CC, 二 | 在 图 C 上 以 结 点 2 起 始 的 广义 地 理学 游戏 中 ,选手 工 有 必 胜 策略 } 

GG 是 PSPACE 完全 的 。 

证 明 思 路 ”用 与 定理 8.8 中 判定 TQBF 时 所 用 的 算法 相似 的 一 个 递归 算法 ， 就 能 判定 
哪 方 有 必 胜 策略 。 该 算法 在 多 项 式 空间 内 运行 ， 所 以 GGE PSPACE, 

为 了 证 明 GG 是 PSPACE 难 的 ， 给 出 一 个 从 FORMULA-GAME 到 GG 的 多 项 式 时 间 





图 8-3 广义 地 理学 游戏 样 例 
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归 约 。 该 归 约 把 一 个 公式 博弈 转化 为 一 个 广义 地 理学 图 ， 使 得 图 上 的 游戏 过 程 模拟 公式 博 
弈 的 游戏 过 程 。 实 际 上 ,广义 地 理学 游戏 的 选手 就 是 在 玩 一 种 编码 形式 的 公式 博弈 。 
证 明 下 面 的 算法 判定 在 广义 地 理学 实例 中 ， 选 手工 是 否 有 必 胜 策 略 。 换 名 话说 ， 它 
判定 CC。 现 证 明 它 在 多 项 式 空 间 内 运行 。 
M= 二 “对 输入 (Gb), GES MRK, b ÆG 的 结 点 : 
. 在 0 出 度 为 0， 则 拒绝 ， 因 为 选手 工 立 即 输 。 
. 删 去 结 点 5 以 及 与 它 关联 的 所 有 箭头 . 得 到 一 个 新 图 G 。 
. 对 于 2 原先 指向 的 每 个 结 点 1 bob FE (G sbi) 上 递归 地 调用 M. 
. 硅 所 有 调用 都 接受 ， 则 选手 了 [在 原先 博弈 中 有 必 胜 策 略 ， 所 以 拒绝 。 否 则 ， 选 
手 卫 没有 必 胜 策 略 ， 而 选手 I 有 必 胜 策略 ， 因 此 接受 。” 
本 算法 仅 需要 用 来 存储 递归 栈 的 空间 。 递 归 的 每 一 层 给 栈 中 添加 一 个 结 点 ， 最 多 可 能 
有 m 层 ，m 是 G 的 结 点 数 。 因 此 算法 在 线性 空间 内 运行 。 
为 了 证 明 GG 的 PSPACE 难 解 性 ， 证 明 FORMULA-GAME 多 项 式 时 间 可 归 约 到 GG。 
归 约 把 公式 


m ow N m 


$ = Ixi Y x2 Izz Q ril] i 
映射 为 广义 地 理学 的 一 个 实例 (Gb). HTHP, KEBE $ 的 量词 以 3 开头 ， 以 3 结尾 ， 
并 且 3 和 VY 严格 地 交替 出 现 ， 不 符合 这 个 假定 的 公式 可 以 转化 为 稍 长 一 些 的 符合 假定 的 公 
式 ， 这 只 需 添 加 一 些 额 外 的 量词 ,约束 一 些 在 别处 不 使 用 的 变量 Ca “OE” Ze). AW 
假定 y 是 合 取 范式 的 (参见 问题 8. 28). 

对 于 归 约 构造 图 G 上 的 地 理学 游戏 ， 其 中 最 优 走 步 模拟 
$ 上 的 公式 博弈 的 最 优 走 步 。 地 理学 游戏 中 的 选手 I 扮演 公 
式 博 弈 中 的 选手 EE 的 角色 ， 选 手 卫 扮演 选手 A 的 角色 。 

图 G 的 结构 部 分 地 示 于 图 8- 4 中 。 游 戏 从 结 点 5 开始， 
它 出 现在 G 的 顶层 左边 。 在 5 下 面 是 一 列 钻石 结构 ，$ 的 每 
一 个 变量 对 应 一 个 。 在 描述 G 的 右边 之 前 ， 先 看 游戏 在 左边 
如 何 进行 。 

游戏 从 5 开始 。 选 手工 必 须 选 择 从 5 出 发 的 两 条 边 之 一 ， 
这 两 条 边 对 应 于 选手 下 在 公式 博弈 开始 时 的 可 能 选择 。 选 手 
I 选择 左边 ， 对 应 于 公式 博弈 中 选手 选择 TRUE， 选 择 右 
边 对 应 于 FALSE。 在 选手 I 已 经 选择 了 一 条 边 之 后 ,假设 
是 左边 那 条 ， 该 选手 [[ 走 步 了 。 因 为 只 有 一 条 出 边 ， 所 以 这 
一 步 没 有 选择 。 类 似 地 ， 选 手工 的 下 一 步 也 没有 选择 ， 游 戏 图 8-4 模拟 公式 博弈 的 地 理学 
从 第 二 个 钻石 的 顶部 继续 进行 。 现 在 再 次 有 两 条 边 ,， 但 是 轮 游戏 的 部 分 结构 
到 选手 开 选 择 了 。 这 次 选择 对 应 于 在 公式 博弈 中 选手 A 的 第 
一 步 。 随 着 游戏 以 这 种 方式 继续 进行 ， 选 手 I 和 开 选 择 向 右 或 向 左 的 路 径 通 过 每 个 钻石 
结构 。 

在 游戏 经 过 所 有 钻石 结构 以 后 ， 路 径 的 末端 在 最 后 一 个 钻石 的 底部 结 点 ， 而 且 轮 到 选手 
] 走 步 了 ， 因 为 假定 最 后 一 个 量词 是 3。 选 手 [ 的 下 一 步 没 有 选择 。 然 后 他 们 到 达 图 8- 4 的 结 
Ac HAAF IEF. 
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地 理学 游戏 走 到 这 一 步 对 应 于 公式 博弈 过 程 的 结束 。 所 选择 的 通过 钻石 结构 的 路 径 对 
应 于 给 $ 的 变量 的 赋值 。 在 该 赋值 下 ， 如 果 yy 是 TRUE， 则 选手 说 得 公式 博 穿 ; WR g 
Æ FALSE, Wit FA im. A 8-5 所 示 的 右边 结构 保证 当选 手下 万 时 选手 I 能 赢 ， 而 且 当 
选手 A 赢 时 选手 开 能 赢 ， 说 明 如 下 。 






nm G s — 3 
> i B 
x; K x : 
0-6 
二 


图 8-5 模拟 公式 博弈 的 地 理学 游戏 的 全 部 结构 ， 其 中 6 二 Ja Yarz dae (ari V zz V 23) A 
Cie V Ze VP A eee A )] 


EHA c, AFUERA y 的 某 个 子 句 的 结 点 ， 然 后 选手 上 可 以 选择 一 个 
对 应 该 子 句 中 的 一 个 文字 的 结 点 。 对 应 不 带 非 的 文字 的 结 点 连接 到 对 应 有 关 变 量 的 钴 石 的 
左边 〈TRUE) ， 对 于 带 非 的 文字 和 右边 (FALSE) 情况 类 似 ， 如 图 8- 5 所 示 。 

如 果 y 是 FALSE， 则 选手 下 可 以 选择 不 满足 的 子 句 而 取胜 。 选 手工 此 时 可 以 选择 的 
文字 都 是 FALSE， 并 被 连 到 钻石 中 还 未 走 过 的 那 一 边 。 于 是 选手 下 可 以 选择 钻石 中 的 那 
个 结 点 ， 而 选手 工 无 法 走 步 了 ， 从 而 输 掉 。 如 果 y 是 TRUE， 则 选手 开 挑 选 的 所 有 子 句 都 
包含 TRUE 文字 。 选 手工 在 选手 开 走 步 后 选择 那个 文字 。 因 为 该 文字 是 TRUE， 所 以 它 
被 连 到 钻石 中 已 经 走 过 的 那 一 边 ， 因 此 选手 开 无 法 走 步 ， 输 掉 。 

定理 8. 11 说 明 在 广义 地 理学 中 ， 不 存在 计算 最 佳 走 步 的 多 项 式 时 间 和 算法， 除非 = 
PSPACE。 我 们 希望 在 计算 如 国际 象棋 这 一 类 棋盘 博弈 的 最 佳 走 步 方面 能 够 证 明 类 似 的 难 
解 性 定理 ， 但 是 存在 一 个 障碍 。 采 用 标准 的 8X8 国际 象棋 棋盘 只 能 出 现 有 穷 个 不 同 的 棋 
局 。 理 论 上 ， 所 有 这 些 棋 局 以 及 它们 的 最 佳 走 步 可 以 放 在 一 张 表 里 。 这 张 表 会 大 到 整个 星 
系 都 放 不 下 ， 但 它 却 是 有 穷 的 ， 可 以 存放 在 图 灵机 的 控制 单元 中 (甚至 有 穷 自动 机 的 控制 
单元 中 !)。 于 是 机 器 就 可 以 通过 查 表 在 线性 时 间 内 走出 最 佳 步 。 也 许 在 将 来 会 有 办 法 度量 
有 穷 问题 的 复杂 性 ， 但 是 目前 的 办 法 是 渐 近 的 ， 因 此 只 能 用 来 度量 复杂 性 随 着 问题 规模 的 
增加 而 变化 的 增长 率 一 一 而 不 能 用 于 任何 固定 规模 。 不 过 ， 通 过 把 许多 棋盘 博弈 推广 到 
nXn 棋盘 上 ， 可 以 就 计算 它们 的 最 佳 走 步 的 难 解 性 给 出 某 些 证 据 。 这 种 推广 的 国际 象棋 、 
跳棋 和 GO 已 被 证 明 是 PSPACE 难 的 ， 甚 至 对 于 更 大 的 复杂 性 类 是 难 的 ， 这 有 赖 于 推广 的 
细节 。 
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8.4 LL 类 和 NL 类 


到 目前 为 止 ， 我 们 只 考虑 了 时 间 和 空间 复杂 性 界限 至 少 是 线性 的 情况 ， 即 界限 fC) 

至 少 是 n。 现 在 考察 更 小 的 亚 线性 (sublinear) 空间 界限 。 在 时 间 复 杂 性 中 ， 亚 线性 界限 
还 不 够 读 完 输入 ， 所 以 这 里 不 考虑 它们 。 在 亚 线性 空间 复杂 性 中 机 器 可 以 读 完整 个 输入 ， 
但 是 它 没有 足够 的 空间 存储 输入 。 为 了 使 对 这 种 情况 的 考虑 有 意义 ， 必 须 修改 计算 模型 。 

下 面 引入 一 种 有 两 条 带子 的 图 灵机 : 一 条 只 读 输 入 带 和 一 条 读 写 工 作 带 。 在 只 读 带 上 
输入 头 能 读 取 符号 ， 但 不 能 改变 它们 。 这 个 头 必须 停留 在 包含 输入 的 那 部 分 带子 上 。 可 以 
给 机 器 提供 一 个 方法 ， 使 它 能 够 检测 读 写 头 处 于 输入 的 左 端 和 右 端 的 时 刻 。 工 作 带 可 以 用 
通常 的 方式 读 写 。 只 有 工作 带 上 被 扫描 的 单元 才 构 成 这 种 形式 的 图 灵机 的 空间 复杂 

可 以 把 只 读 输 入 带 想象 成 CD-ROM， 即 一 种 在 许多 个 人 计算 机 上 用 于 输入 的 设备 。 
通常 ，CD-ROM 包含 的 数据 比 计算 机 能 存放 在 主 存 中 的 数据 更 多 。 亚 线性 空间 算法 允许 
计算 机 处 理 没有 全 部 存放 在 主 存 中 的 数据 。 

对 于 至 少 是 线性 的 空间 界限 ， 双 带 图 灵机 模型 等 价 于 标准 的 单 带 模 型 (参见 练 
3 8. 1), Rib clic SB] ALB. FR AA air Be , 

L 是 确定 型 图 灵机 在 对 数 空间 内 可 判定 的 语言 类 。 换 言 之 ， 

L = SPACE(Clog n) 
NL 是 非 确定 型 图 灵机 在 对 数 空间 内 可 判定 的 语言 类 。 换 言 之 ， 
NL = NSPACE(log n) 

我 们 关注 log n 空间 ， 而 不 关注 如 Vn 或 log?n 空间 的 理由 与 选择 多 项 式 时 空 界限 的 理 
由 相似 。 对 数 空间 足以 求解 许多 有 趣 的 计算 问题 ， 而 且 其 数学 性 质 也 富有 吸引 力 ， 比 如 当 
机 器 模型 和 输入 的 编码 方法 改变 时 仍 保持 稳健 性 。 指 向 输入 的 指针 可 以 在 对 数 空 间 内 表 
示 ， 所 以 考虑 对 数 空 间 算法 的 计算 能 力 的 一 种 方式 是 考虑 固定 数目 的 输入 指针 的 计算 
能 力 。 

GEER) 语言 4={0:1: 14 二 0; 是 工 的 成 员 。 在 7.1 节 中 描述 了 一 个 判定 A 的 图 灵 
机 ， 它 左右 来 回 扫描 输入 ， 删 掉 匹 配 的 0 和 1。 该 算法 用 线性 空间 记录 哪些 位 置 已 经 被 删 
掉 了 ， 但 可 以 修改 为 只 使 用 对 数 空间 。 

判定 A 的 对 数 空 间 图 灵机 不 能 删除 输入 带 上 已 经 匹配 的 0 和 1， 因为 该 带 是 只 读 的 。 
机 器 在 工作 带 上 用 二 进 制 分 别 教 0 和 1 的 数目 ， 唯一 需要 的 空间 是 用 来 记录 这 两 个 计数 器 
的 。 在 二 进 制 形 式 下 ， 每 个 计数 器 只 消耗 对 数 空间 ， 因 此 算法 在 O(log n) 空间 内 运行 
所 以 AEL。 = 

GERD fiz 7.2 he LWIA PATH={(G,s,t)|GEBEM s At 的 有 向 路 径 
的 有 向 图 } 。 定 理 7.12 证 明 PATH 属于 P, 但 是 给 出 的 算法 消耗 线性 空间 。 还 不 清楚 
PATH 是 否 能 确定 性 地 在 对 数 空 间 内 解决 ， 但 是 的 确 知道 一 个 判定 PATH 的 非 确 定性 的 
对 数 空间 算法 。 

判定 PATH 的 非 确定 型 对 数 空间 图 灵机 从 结 点 * 开始 运算 ， 非 确定 地 猜测 从 * 到 + 的 
路 径 的 每 一 步 。 机 器 在 工作 带 上 只 记录 每 一 步 当 前 结 点 的 位 置 ， 而 不 是 整 条 路 径 (否则 将 
超出 对 数 空间 的 要 求 ) 。 机 器 从 当前 结 点 所 指向 的 结 点 中 非 确 定 地 选择 下 一 个 结 点 。 它 反 
复 执行 这 一 操作 ， 直 至 到 达 结 点 1 而 接受 ， 或 者 执行 m 步 以 后 拒绝 ， 其 中 mm 是 图 中 的 结 点 


数 。 因 此 PATH JRF NL. m 

以 前 所 得 出 的 关于 f(n) 空间 界限 的 图 灵机 也 在 209”? EN Ta] A AY eT F E A h 
的 空间 界限 就 不 再 成 立 。 例 如 ， 消 耗 O(1) ( 即 常数 ) 空间 的 图 灵机 就 可 能 运行 n 步 。 为 
了 获得 适用 于 所 有 空间 界限 (a) 的 运行 时 间 界 限 ， 给 出 下 面 的 定义 。 

若 M 是 一 个 有 单独 的 只 读 输入 带 的 图 灵机 ， 也 是 输入 ， 则 M 在 w 上 的 
格局 包含 状态 、 工 作 带 和 两 个 读 写 头 位 置 。 输 入 ww 不 作为 M Ew 上 的 格局 的 一 部 分 。 

如 果 Me fn) 空间 内 运行 ，w 是 长 为 n HRA, M ME w 上 的 格局 数 是 n20%1"”， 
为 了 解释 这 一 结果 ， 设 M 有 cc 个 状态 和 gg 个 带子 符号 。 能 够 出 现在 工作 带 上 的 字符 串 的 
数目 是 gw。 输入 头 可 以 处 在 个 位 置 之 一 ， 工 作 带 头 可 以 处 在 f(n) 个 位 置 之 一 。 因 此 
ME w 上 的 格局 总 数 (也 就 是 M Ew 上 的 运行 时 间 的 上 界 ) 等 于 cnf (n) g” 
或 n2 (Of@) 

我 们 几乎 只 关注 不 小 于 log n 的 空间 界限 f(n)。 对 于 这 样 的 界限 ， 前 面 关 于 机 器 的 时 
间 复 杂 性 最 多 不 超过 它 的 空间 复杂 性 的 指数 倍 的 断言 依然 成 立 ， 因 为 当 f(n) 宇 log n 时 ， 
n20f (nm)) 等 于 DOS) ， 

回忆 一 下 ， 萨 维 奇 定理 表明 ， 非 确定 型 图 灵机 可 以 转化 为 确定 型 图 灵机 ， 而 在 fnn 
时 ， 空 间 复 杂 性 f(n) 只 增加 平方 。 可 以 推广 萨 维 奇 定 理 ， 使 它 对 于 亚 线性 空间 界限 fn) 
log 7 也 能 成 立 。 证 明 与 7. 1 节 给 出 的 原始 证 明基 本 相同 ， 只 是 采用 有 只 读 输 入 带 的 图 灵 
机 ， 在 涉及 N 的 格局 的 地 方 改 用 NN 在 w EKR., A N Ew 上 的 格局 需要 
log(n 2? )=log n+OCf(n)) 空间 。 如 果 f(n) 宇 log n， 则 存储 消耗 是 OC(f(n))， 证明 
的 其 余部 分 都 相同 。 


8.5 NL 完全 性 


正如 在 例 8. 14 中 提 到 的 , 已 知 PATH 问题 属于 NL, 但 不 知道 它 是 否 在 LL 中。 人 们 相 
信 PATH AEF L, 但 是 不 知道 怎样 证 明 这 一 猜想 。 实 际 上 ， 还 不 知道 NL 中 有 哪 一 个 问题 
可 以 被 证 明 不 属于 L。 类 似 于 P= 二 NP 是 否 成 立 的 问题 ， 也 有 L=NL 是 否 成 立 的 问题 。 

作为 解决 L 与 NL 问题 的 一 个 步骤 ， 需 要 先 证 明 某 些 语言 是 NL 完全 的 。 正 如 其 他 复 
杂 性 类 的 完全 语言 一 样 ，NL 完全 语言 在 一 定 意 义 上 是 NL 中 最 困难 的 语言 的 样 例 。 如 果 
L 与 NL 不 相等 ， 那 么 所 有 NL 完全 语言 就 不 属于 L. 

如 前 面 完全 性 的 定义 一 样 ，NL 完全 语言 定义 为 属于 NL， 并 且 NL 中 的 所 有 其 他 语言 
都 可 归 约 到 它 。 但 是 这 里 不 用 多 项 式 时 间 可 归 约 性 ， 这 是 因为 所 有 NL 中 的 问题 都 在 多 项 
SUT TB] A FY fe. BR OA 3* 以 外 ，NL 中 的 任何 两 个 问题 都 是 互相 多 项 式 时 间 可 归 约 的 
(参见 8. 3 节 PSPACE 完全 性 的 定义 中 关于 多 项 式 时 间 可 归 约 性 的 讨论 )， 所 以 多 项 式 时 
间 可 归 约 性 太 强 ， 不 能 把 NL 中 的 问题 彼此 区 分 开 。 可 以 改 用 一 种 新 型 可 归 约 性 ， 称 为 对 
数 空 间 可 归 约 性 。 

对 数 空间 转换 器 Clog space transducer) 是 有 一 条 只 读 输 入 带 、 一 条 只 
写 输 出 带 和 一 条 读 / 写 工作 带 的 图 灵机 。 输 出 带 的 头 部 不 能 向 左 移动 ， 因 此 它 不 能 读 已 写 
内 容 。 工 作 带 可 以 包含 O(log(n)) 个 符号 。 对 数 空间 转换 器 M 计算 一 个 函数 :35* 一 5*， 
其 中 fw) 是 把 ww 放 在 M 的 输入 带 上 启动 M 运行 到 M 停机 时 输出 带 上 存放 的 字符 串 。 
RK 广 为 对 数 空间 可 计算 函数 (log space computable function)。 如 果 语 言 A 通过 对 数 空间 
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可 计算 函数 了 映射 可 归 约 到 语言 B， 则 称 A 对 数 空 间 可 归 约 (log space reducible) 到 B, 
WA ALB, 

现在 已 经 做 好 定义 NL 完全 性 的 准备 。 

语言 B 是 NL 完全 的 ， 如 果 

1 BENL, 并 且 

2. NL 中 的 每 个 A 对 数 空间 可 归 约 到 B。 

如 果 一 个 语言 对 数 空 间 可 归 约 到 男 一 个 已 知 属于 LL 的 语言 ， 则 这 个 语言 也 属于 L， 如 
下 述 定理 所 阐明 的 。 

A<, B ABEL, MAEL, 

证 明 本 定理 的 一 个 诱 人 的 证 明 思路 是 仿照 定理 7.25 的 模式 ， 那 里 证 明了 多 项 式 时 
间 可 归 约 性 的 类 似 结果 。 按 照 这 种 思路 ，A 的 对 数 空间 算法 首先 用 对 数 空间 归 约 f 把 输入 
w 映射 为 1(w)， 然 后 应 用 B 的 对 数 空间 算法 。 但 是 存储 f(w) 的 空间 需求 量 可 能 太 大 ， 
不 能 放 进 对 数 空间 界限 内 ， 所 以 需要 修改 这 种 方法 ，。 

A 的 机 器 M4a 不 再 算出 整个 f(w)， 而 是 当 B 的 机 器 Ms 知 要 的 时 候 计 算 fw) 的 个 别 
符号 。 在 模拟 过 程 中 ，MA 记 录 MB 的 输入 头 在 jw) 上 的 位 置 。 每 一 次 Ms 移动 时 。Ma 
重新 开始 在 w 上 计算 ff， 除 了 所 需要 的 f(w) 上 的 位 置 以 外 ， 其 余 输出 全 部 忽略 。 这 人 么 做 
可 能 不 时 地 要 求 重 新 计算 f(w) 的 某 些 部 分 ， 因 而 在 时 间 复 杂 性 方面 是 低 效 的 。 这 种 方法 


的 好 处 是 在 任何 时 刻 只 需 存 储 f(w) 的 一 个 符号 ， 其 结果 是 用 时 间 来 换取 空间 。 a 
若 有 一 个 NL 完全 语言 属于 L， 则 L=NL, 
图 中 的 搜索 


PATH 是 NL 完全 的 。 

证 明 思 路 例 8.14 证 明了 PATH 属于 NL， 所 以 只 需 证明 PATH 是 NL 难 的 。 换 言 
之 ， 必 须 证 明 NL 中 的 每 个 语言 A 对 数 空间 可 归 约 到 PATH., 

从 A 到 PATH 的 对 数 空 间 归 约 背后 的 思想 是 构造 一 个 图 ， 用 来 表示 判定 A 的 非 确定 
型 对 数 空 间 图 灵机 的 计算 过 程 。 归 约 把 字符 串 w 映射 为 一 个 图 ， 图 中 结 点 对 应 于 非 确 定型 
图 灵机 在 输入 w 上 的 格局 。 一 个 结 点 能 指向 男 一 个 结 点 的 条 件 是 第 一 个 结 点 对 应 的 格局 能 
在 非 确 定型 图 灵机 的 一 步 内 产生 第 二 个 结 点 对 应 的 格局 。 因 此 ， 只 要 从 对 应 初始 格局 的 结 
点 到 对 应 接受 格局 的 结 点 之 间 存 在 一 条 路 径 ， 则 机 器 接受 w 

证 明 这 里 说 明了 怎样 给 出 一 个 从 NL 中 的 任意 语言 A 到 PATH 的 对 数 空间 归 约 。 
设 非 确 定型 图 灵机 M 在 O(logn) 空间 内 判定 A。 给 定 输入 w， 在 对 数 空 间 内 构造 (Gs:t), 
其 中 G 为 有 向 图 ，G 包含 从 s 到 + 的 路 径 当 且 仅 当 M 接受 w. 

G 的 结 点 是 M Aw 上 的 格局 。 对 于 M 在 ww 上 的 格局 cl 和 c, WR ce 是 MA 从 ci 出 发 
的 下 一 个 可 能 的 格局 ， 则 Ccc) 是 G 的 一 条 边 。 更 精确 地 说 ， 如 果 M eB we, 
cl 的 状态 和 它 的 输入 带头 和 工作 带头 下 的 符号 一 起 能 产生 下 一 个 状态 和 带头 动作 ， 使 cl 变 
成 cz， 那么 Casc) 是 G 的 一 条 边 。 结 点 :是 M 在 w 上 的 初始 格局 。 机 器 M 被 修改 为 只 
有 唯一 的 接受 格局 ， 把 该 格局 指定 为 结 点 to 

该 映射 把 A HAA PATH, 原因 是 只 要 M 接受 输入 ， 它 就 有 一 个 计算 分 支 接受 ， 这 
对 应 于 G 中 一 条 从 起 始 格 局 s 到 接受 格局 上 的 路 径 。 反 之 ， 如 果 G 中 存在 从 s 到 上 的 路 径 ， 
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则 M 在 输入 w 上 运行 时 ， 某 个 计算 分 支 必 定 接受 ， 从 而 M 接受 w., 

为 了 证 明 该 归 约 在 对 数 空 间 内 运算 ， 给 出 一 个 对 数 空 间 转 换 器 ， 它 在 输入 w 上 输出 
《G,s,t)。 通 过 列 出 G 的 结 点 和 边 来 描述 G。 列 出 结 点 很 容易 ， 因 为 每 个 结 点 是 M 在 w 上 
的 一 个 格局 ， 可 以 在 空间 clog n 内 表示 出 来 ，c 是 某 个 常数 。 转 换 器 顺序 地 走 遍 所 有 可 能 
的 长 为 cog n 的 字符 串 ， 检 查 每 一 个 是 否 为 M 在 w 上 的 合法 格局 ， 输 出 那些 通过 检查 的 
字符 串 。 类 似 地 ， 转 换 器 也 列 出 边 。 对 数 空间 足以 验证 M Ew 上 的 一 个 格局 cl 能 否 产 生 
格局 cz ， 因 为 转换 器 只 需 通过 考察 cl 中 读 写 头 位 置 下 的 带子 内 容 ， 以 此 来 决定 M 的 转移 
函数 是 否 会 产生 格局 co 作为 结果 。 转 换 右 依次 检查 所 有 的 (ci ,cz )， 探 知 哪些 是 G 的 合格 
的 边 。 那 些 合 格 的 边 被 添加 到 输出 带 上 。 a 

定理 8.20 的 一 个 直接 的 副产品 是 下 面 的 推论 ， 它 称 NL 是 P 的 子 集 。 

NLCP, 

WEAR 定理 8. 20 说 明 ，NL 中 的 任何 语言 对 数 空间 可 归 约 到 PATH. Bp. Ñ 
耗 空间 f(r) 的 图 灵机 在 时 间 n2%*” 内 运行 ， 所 以 在 对 数 空间 内 运行 的 归 约 器 也 在 多 项 
式 时 间 内 运行 。 因 此 ，NL 中 的 任何 语言 多 项 式 时 间 可 归 约 到 PATAH， 由 定理 7.12 知 后 
者 属于 了 P。 又 知 每 一 个 多 项 式 时 间 可 归 约 到 了 中 的 语言 的 语言 也 在 P 中 ， 所 以 证 毕 。 8 

虽然 对 数 空 间 可 归 约 性 限制 更 加 严格 ， 但 是 由 于 计算 问题 通常 是 简单 的 ， 故 对 于 复杂 
性 理论 中 的 大 多 数 归 约 来 说 ， 它 已 经 够 用 了 。 例 如 在 定理 8.8 中 , 已 经 证 明了 每 一 个 
PSPACE 问题 在 多 项 式 时 间 内 归 约 到 TQBF。 在 归 约 过 程 中 产生 了 重复 度 高 的 公式 ， 它 们 
或 许可 在 对 数 空 间 内 计算 ， 因此 或 许可 以 得 出 结论 : 利用 对 数 空间 ，TQBF 是 PSPACE 
完全 的 。 这 个 结论 在 推论 9.6 中 证 明 NLG PSPACE 时 非常 有 用 。 这 种 分 离 和 对 数 空 间 可 
归 约 性 表明 TQBF ENL。 


8.6 NL 等 于 coNL 


本 节 包 含有 关 复 杂 性 类 之 间 相 互 关 系 的 已 知 结果 中 最 惊人 的 结果 之 一 。 一 般 认 为 NP 
与 coNP 是 不 相等 的 。 乍 一 看 ， 同 样 的 结果 对 于 NL 和 coNL 似乎 也 成 立 。 事 实 上 ， 正 如 
将 要 证 明 的 ，NL 等 于 coNL。 这 说 明 我 们 关于 计算 的 直觉 仍 有 许多 空白 。 

NL=coNL, 

证 明 思 路 ”为 了 证 明 coNL 中 的 每 个 问题 也 在 NL 中 ， 先 证 明 PATH 属 于 NL， 因 为 
PATH 是 NL 完全 的 。 所 给 出 的 判定 PATH 的 NL 算法 M 在 图 G 不 包含 从 s 到 上 的 路 径 
时 ， 必 须 有 一 个 接受 计算 。 

首先 解决 一 个 容易 些 的 问题 。 令 c 是 G 中 从 s 可 达 的 结 点 数 。 假 定 c 作为 输入 提供 给 
M， 先 说 明 怎 样 利用 c 求解 PATH ， 然 后 再 说 明 怎 样 计 算 c. 

WE G,s,t 和 c， 机 器 M 如 下 运算 。M 逐个 地 走 遍 G 的 所 有 m 个 结 点 ， 非 确定 地 猜 
测 每 个 结 点 是 否 从 s 可 达 。 一 旦 结 点 被 猜测 为 可 达 ，M 就 通过 猜测 一 条 从 s Blu 的 路 径 
来 验证 这 一 点 。 如 果 一 个 计算 分 支 没 能 在 m 步 内 验证 这 一 猜测 (m 是 G 的 结 点 数 )， 就 拒 
绝 。 另 外 ， 如 果 一 个 分 支 猜测 上 可 达 ， 就 拒绝 。 机 器 M 对 那些 已 经 被 验证 为 可 达 的 结 点 计 
数 。 当 一 个 分 支 走 遍 G 的 所 有 结 点 后 ， 它 查验 从 s 可 达 的 结 点 数 是 否 等 于 c 〈 即 实际 可 达 
的 结 点 数 ) ， 如 果 不 等 于 就 拒绝 。 否 则 该 分 文 接受 。 

换言之 ， 如 果 M 恰好 非 确定 地 挑选 了 从 s 可 达 的 c 个 结 点 AAO. HAW 
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路 径 证 实 了 每 一 个 都 从 可 达 ， 则 M 就 知道 剩余 的 结 点 (包括 t) 都 不 可 达 ， 所 以 它 就 可 
以 接受 。 

接 下 来 说 明 怎 样 计 算 <c， 即 从 s 可 达 的 结 点 数 。 描 述 一 个 非 确定 的 对 数 空间 过 程 至 少 
有 一 个 计算 分 支 具有 正确 的 < 值 ， 而 所 有 其 他 分 支 都 拒绝 。 

对 于 从 0 到 m 的 每 个 值 i， 定 义 A; 为 G 中 与 s 的 距离 不 超过 i 的 结 点 的 集合 〈 即 从 s 
出 发 有 一 条 长 度 不 超过 i W). FEAS {s}, YAAGA, An 包含 从 s 可 达 的 所 
Afim. Oc 是 A; 中 的 结 点 数 。 下 面 描述 一 个 过 程 ， 从 ci 中 计算 出 cito REMAX 
过 程 ， 就 获得 所 需 的 值 c= cm 。 

从 ci 中 计算 出 ci+1 所 用 的 思路 与 前 面 给 出 的 思路 相似 。 算 法 走 遍 G 的 所 有 结 点 ， 决 
定 每 一 个 结 点 是 否 为 Ai+1 的 成 员 ， 然 后 数 成 员 的 个 数 。 

AS AER v 是 否 在 Ai+1 中 ， 用 一 个 内 层 循环 走 遍 G 的 所 有 结 点 ， 猜 测 每 一 个 结 
MERE A 中 。 每 一 次 成 功 的 猜测 是 由 猜测 一 条 从 s 出 发 、 长 度 至 多 为 i 的 路 径 来 证 实 。 
对 于 每 个 证 实 了 在 A; 中 的 结 点 uw， 算 法 检查 (u,v) 是 否 是 G 的 一 条 边 。 如 果 是 其 中 的 一 
条 边 ， 则 "在 Ai+li 中 。 另 外 ,证 实 了 在 A; 中 的 结 点 的 数目 也 被 计算 出 来 。 在 内 层 循环 结 
束 时 ， 如 果 证 实 属于 A 的 结 点 总 数 不 等 于 c;， 则 A; 的 全 部 结 点 还 没有 被 找 完 ， 所 以 该 计 
算 分 支 拒 绝 。 如 果 总 数 的 确 等 于 c, HH wv 还 没有 证 实 属 于 A;+1， 则 可 以 下 结论 说 它 不 在 
Ai+1 中 。 然 后 走 到 下 一 个 v， 开始 外 层 循环 。 

证 明 判定 PATH 的 算法 如 下 。 这 里 令 m 为 G 的 结 点 数 。 

M 二 “对 输入 (G,s,t): 


l & =l, d=0, LAo= {s 1 ^A] 

2. 对 i 二 0 到 m—1: [从 ci HA cir] 

3 令 cii =l, [ci+1 计 数 在 A PRR 

4. 对 G 中 的 每 个 结 点 v (vss): [检查 是 否 v€ A +1 | 

5. & d=0, Ld 计数 A; 中 的 结 点 数 ] 

6. 对 G 中 的 每 个 结 点 x: [检查 是 否 uc A; | 

a, 非 确 定 地 执行 或 者 跳 过 下 列 步 又 : 

8. 非 确 定 地 沿 着 从 s 出 发 、 长 度 至 多 为 i 的 路 径 行 进 ， 如 果 没 
AWER w， 就 拒绝 。 

9. d 加 1。 [u€ A; ] 

10. WR (u,v) 是 G 的 一 条 边 ， 则 ci;+1 加 1。w 变 为 下 一 个 结 
Ao Fema RS. Lot Ar | 

ll. 若 4 天 ci， 则 拒绝 。 [检查 是 否 找到 所 有 A: | 

12. $ d=0, [现在 已 知 cms d 计数 Am 中 的 结 点 数 ] 

13. 对 G 中 的 每 个 结 点 u: [检查 是 否 uC An | 

14. ” 非 确定 地 执行 或 跳 过 下 列 步 骤 : 

15. 非 确 定 地 沿 着 从 s 出 发 、 长 度 至 多 为 m 的 路 径 行 进 ， 如 果 没 有 碰 到 结 

KA u 就 拒绝 。 
16. 若 x 一 上 ， 则 拒绝 。 [找到 从 s 到 上 的 路 径 ] 


1%. dil. [uE An | 


224 PARQ 复杂 性 理论 


18. 若 d 关 cm， 则 拒绝 ; 否则 ， 接 受 。” [检查 是 否 找 到 所 有 属于 A 的 结 点 j 

在 任何 时 刻 ， 本 算法 只 需 存 储 m,u,v,ci,citi,d,i 和 一 个 指 癌 路 径 末 端的 指针 ， 所 以 

它 在 对 数 空间 内 运行 。( 注 意 : M 也 接受 格式 错误 的 输入 。) s 
把 当前 已 知 的 关于 几 个 复杂 性 类 之 间 相 互 关系 的 认识 总 结 如 下 : 
LE NL = coNL C PC NPC PSPACE 

我 们 还 不 知道 这 些 包 含 关 系 是 否 有 真 包 含 ， 虽 然 在 第 9 童 推论 9.6 中 将 证 明 NL G 

PSPACE® 。 所 以 ，coNLSEP 和 了 PSEPSPACE 中 一 定 至 少 有 一 个 成 立 ， 但 是 不 知道 哪 一 个 

成 立 ! 大 多 数 研 究 者 推 想 所 有 这 些 包 含 关系 都 是 真 包含 。 


练习 


8.1 证 明 对 于 任意 函数 f: NR, EP f(n) 宇 x， 不 论 用 单 带 图 灵机 模型 还 是 用 双 带 只 读 输入 图 
灵机 模型 ， 所 定义 的 空间 复杂 性 类 SPACE(f(n)) 总 是 相同 的 。 

8.2 考虑 下 面 标准 的 儿童 游戏 的 棋局 。 设 下 一 步 轮 到 X 方 选手 走 。 请 描述 该 选手 的 必 胜 策略 。( 回 忆 
前 边 所 学 内 容 ， 必 胜 策略 不 仅仅 是 在 当前 棋局 中 的 最 佳 走 步 ， 它 还 包括 该 选手 为 了 取胜 而 必须 
采取 的 所 有 应 手 ， 不 论 对 手 如 何 走 步 。) 


O x 


8.3 考虑 下 图 所 示 的 广义 地 理学 游戏 ， 其 中 起 始 结 点 就 是 由 无 源 箭头 指向 的 结 点 。 选 手 I 有 必 胜 策 
略 吗 ?选手 卫 呢 ?给 出 理由 。 


8.4 证 明 PSPACE 在 并 、 补 和 星 号 运算 下 封闭 。 
A8.5 WEH Apra EL. 

8.6 证 明 PSPACE 难 的 语言 也 是 NP 难 的 。 
48.7 证 明 NL 在 并 、 连 接 和 星 号 运算 下 封闭 。 


问题 

* 8.8” 尼 姆 游戏 的 道具 是 几 堆 树枝 。 在 一 步 中 ， 选 手 从 一 个 堆 中 拿 走 至 少 一 根 树枝 。 选 手 们 轮流 交替 
地 拿 走 树枝 ， 拿 走 最 后 一 根 树枝 的 选手 算 输 。 假设 在 尼 姆 的 一 个 局 势 中 有 上 堆 树 枝 ， 每 堆 分 别 
包含 5 ,… ,st 根 树枝 。 如 果 把 每 个 数 s; 写成 二 进 制 形式 ， 并 且 每 个 二 进 制 数 排 成 矩阵 的 一 行 ， 
低位 对 齐 以 后 ， 每 一 列 包含 偶数 个 1， 则 称 局 势 是 平衡 的 。 证 明 下 面 两 个 事实 : 
a. 从 一 个 非 平衡 的 局 势 出 发 ， 存 在 一 步 使 得 局 势 变 成 平衡 的 。 
b. 从 一 个 平衡 的 局 势 出 发 ， 每 一 步 都 使 得 局 势 变 成 非 平衡 的 。 


今 


NIM = {(s, 5°55.) | 每 个 s; ZL HARK HF | 在 尼 姆 游戏 中 从 该 局 势 出 发 有 必 胜 策略 } 
利用 前 面 关 于 平衡 局 势 的 事实 证 明 NIM 属于 L. 
8.9 令 MULT={a#6#cla,b,c 是 二 进 制 自然 数 且 aX6b=c)}。 WHA MULTEL。 


© ASsB 表示 A 是 B 的 真子 集 。 一 一 译 者 注 
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对 任意 正 整 数 r, C2 RH rW HERMESE Ri z 的 二 进 制 形式 首位 不 是 

0). ELKAR :N>N, EPR (z) 一 z 十 xzR 。 

a. 令 A: 一 {(zy)|R (x) =y), 证 明 AL EL. 

b. 令 Az={(z,y) IR (R+(x))=y}, WH A EL. 

a. 4 ADD= {(z,y,z)|\z,y,z>0 HAH BRM, r+y=z}, 证明 ADDEL, 

b. $ PAL-ADD=({(z,y)|\z,y>0 HATH Hl BM, rty 是 整数 且 其 二 进 制 表示 是 回 文 ;。( 假 
设 求 和 的 结果 的 二 进 制 首位 不 是 0， 顺 读 和 倒 读 都 是 一 样 的 字符 串 称 为 回 文 。) 证 明 PAL 
ADDEL。 

令 UCYCLE={(G)|G 是 包含 一 个 简单 回路 的 无 向 图 } ， 证 明 UCYCLEEL。( 注 : G 可 能 不 是 连 

通 图 。) 

证 明 对 每 个 x， 存在 两 个 长 度 为 poly(n) 的 正则 表达 式 R 和 S， 其 中 L(R) 关 L(S), 但 它们 包含 

的 第 一 个 相 异 的 字符 串 是 指数 长 的 。 换 言 之 ，L(R) ALIS) 必须 是 不 同 的 ， 然 而 对 某 些 常量 

s 二 0， 字符 串 的 长 度 为 2” 时 二 者 是 一 样 的 。 

如 果 无 向 图 的 结 点 可 以 分 成 两 个 集合 ， 使 得 所 有 边 都 从 一 个 集合 的 结 点 连 到 男 一 个 集合 的 结 

点 ， 则 该 无 向 图 称 为 二 部 的 〈bipartite) 。 证 明 一 个 图 是 二 部 的 当 且 仅 当 它 不 含有 奇数 个 结 点 的 

圈 。 令 

BIPARTITE = {(G) | G 是 二 部 图 ) 

证 明 BIPARTITEENL. 

令 UPATH 是 无 向 图 中 PATH 的 对 偶 , 证 明 BIPARTITE<LUPATH 。( 注 : 在 文献 O，Rein- 

gold[62] 中 证 明了 UPATH EL, Alt BIPARTITEEL, 但 其 算法 有 点 复杂 。,) 

回忆 一 下 ， 在 有 向 图 中 ， 如 果 每 一 对 结 点 间 都 有 双向 的 有 向 路 径 连 接 ， 则 它 称 为 强 连通 的 

(strongly connected), 4 

STRONGLY-CONNECTED = {(G) | G 是 强 连通 图 } 

证 明 STRONGLY-CONNECTED 是 NL 完全 的 。 

令 BOT Hyra = {(M, ,Mz )|M, M M: 是 NFA,L(Mi) 门 L(M;) 关 如}。 证明 BOTHNFA 是 NL 完 

全 的 。 

WEH Arra dt NL 完全 的 。 

证 明 Enora Æ NL 完全 的 。 

证 明 2SAT 是 NL 完全 的 。 

S CNFH = 二 {4$)1$ 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包含 任意 多 个 肯定 的 文字 ， 但 最 多 

只 有 一 个 否定 的 文字 。 并 且 ， 每 个 否定 的 文字 在 $ 中 最 多 出 现 一 次 }。 证 明 CNFm# NL SZ 

全 的 。 

给 出 一 个 是 NL 完全 的 上 下 无 关 语言 。 

令 CYCLE= 二 {4(G )1G 是 包含 一 个 有 问 回 路 的 有 向 图 }。 证 明 CYCLE 是 NL 完全 的 。 

令 EQrex={(R,S)|RAS 是 等 价 的 正则 表达 式 }。 证 明 EQrex € PSPACE, 

梯子 (ladder) 是 一 个 字符 串 的 序列 s1 ,sz ,…,s% ， 其 中 每 个 字符 串 与 前 一 个 字符 串 恰 好 只 在 一 

个 字母 上 不 同 。 例 如 ， 下 面 是 一 个 英文 单词 的 梯子 : 

head, hear, near, fear, bear, beer, deer, deed, feed, feet, fret, free 
4> LADDERpra = {(M,s,t)|M 是 一 个 DFA, LIM) 包含 一 个 以 字符 串 s 开头、 以 字符 串 : 
结束 的 梯子 } 。 证 明 LADDERpra JB PSPACE. 

五 子 棋 游 戏 由 两 名 选手 “X” 和 “0O” 在 19X19 的 网 格 上 上 比赛。 选手 们 轮流 放 模 子 ， 第 一 个 把 

自己 的 5 个 棋子 连续 地 放 在 一 行 、 一 列 或 者 一 条 对 角 线 上 的 选手 就 是 赢家 。 考 虑 把 该 游戏 推广 

到 nXn 棋盘 上 。 令 

GM = {4B》| B 是 推广 的 五 子 棋 的 棋局 ,其 中 选手 “X” 有 必 胜 策略 } 
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这 里 的 棋局 是 指 放 有 一 些 棋子 的 棋盘 ， 它 可 能 在 下 棋 的 过 程 中 出 现 。 
证 明 GME PSPACE, 
8.27 ”证明 如 果 每 一 个 NP 难 的 语言 也 是 PSPACE 难 的 ， 则 PSPACF=NP, 
8.28 ”证 明 当 限制 跟 在 量词 后 面 的 那 部 分 公式 是 合 取 范式 时 ，TQBF 仍 是 PSPACE 完全 的 。 
8.29 定义 Arpa={(M,w)|M 是 一 个 接受 输入 w 的 LBA}, 证 明 Arsa Æ PSPACE 完全 的 。 
* 8.30 猫 捉 老鼠 游戏 由 两 名 选手 “ 猫 ” 和 “老鼠 ”在 一 个 任意 的 无 向 图 上 竞赛 。 在 给 定时 刻 ， 每 名 选 
手 占 据 图 的 一 个 结 点 。 选 手 们 轮流 走 到 与 当前 占据 的 结 点 相 邻 的 结 点 上 。 图 中 有 一 个 特殊 的 结 
点 称 为 “ 洞 ?”。 如 果 双 方 同 时 占据 同一 个 结 点 ， 则 猫 赢 。 如 果 老 鼠 在 此 之 前 到 达 洞 ， 则 老鼠 赢 。 
如 果 双 方 同时 到 达 以 前 占据 的 位 置 ， 则 为 平局 。 令 
HAPPY-CAT = ((G,c,m,h) | Gycy 四 分 别 为 图 和 猫 的 位 置 、 老鼠 的 
位 置 和 洞 , 使 得 如 果 猫 先 走 , 则 猫 有 必 胜 策略 } 
证 明 HAPPY-CAT 属于 了。 
8.31 考虑 问题 7. 39 中 描述 的 语言 PUZZLE 的 双人 版 。 每 名 选手 开始 时 都 有 一 合 排 好 序 的 谜 卡 。 他 
们 轮流 地 按 序 把 卡片 放 进 盒子 ， 并 有 权 选 择 哪 一 面 朝 上 。 如 果 在 最 终 的 盒子 中 所 有 和 孔 的 位 置 都 
被 堵 住 了 ， 则 选手 工 赢 。 如 果 还 有 和 孔 的 位 置 没 被 堵 住 ， 则 选手 T 赢 。 证 明 对 于 给 定 的 卡片 的 起 
始 格局 ， 判 定 哪 位 选手 有 必 胜 策略 的 问题 是 PSPACE 完全 的 。 
8.32 理解 在 问题 7. 21 中 对 MIN- FORMULA 的 定义 。 
a. 证 明 MIN- FORMULA € PSPACE, 
b. 解释 下 面 的 论证 为 何不 能 证 明 MIN- FORMULA E coNP: 
如 果 gE MIN-FORMULA ， 则 上 有 更 小 的 等 价 公 式 。 一 个 非 确 定型 图 灵机 通过 猜测 这 个 等 
价 公 式 能 验证 pE MIN- FORMULA. 
8.33 设 A 是 由 正确 艇 套 的 圆 括号 组 成 的 语言 。 例 如 ，(C( )) 和 (()(()))() BA. 而 )( 则 不 属于 
A, WH A BFL. 
* 8.34 KBE ERAREN RE SATRSARWB A. Ml, COOJOLD BB, m DJA 
属于 B. WH BTL. 
习题 选 解 
8.5 构造 一 个 图 灵机 M 判 定 Aprfa 。 对 于 输入 〈A, 世 (其 中 A 为 DFEA， 双 是 一 个 字符 串 ) ，M 在 也 
上 模拟 A， 方 法 是 通过 跟踪 A 的 当前 状态 和 输入 头 的 位 置 ， 并 适时 地 修改 它们 。 因 为 只 需要 存 
储 指 向 输入 的 指针 ， 所 以 完成 这 个 模拟 需要 的 空间 是 O(log n). 
8.7 $A, A 分 别 是 由 NL 机 器 Ni 和 N: 判定 的 语言 。 构 造 三 个 图 灵机 : Nu AE AUA, No 


HEA CA, N, 判定 Ar ， 每 个 图 灵机 的 输入 为 w. 
图 灵机 NU 不 确定 地 分 支 来 模拟 Ni 或 Ne ， 在 两 种 情况 下 ， 如 果 被 模拟 的 机 器 接受 ， 则 Nu 
接受 。 
图 灵机 No 不 确定 地 在 输入 串 中 选择 一 个 位 置 将 它 分 成 两 个 子 串 。 由 于 没有 足够 的 空间 存储 子 
串 ， 所 以 在 工作 带 上 只 存放 该 位 置 的 指针 。 首 先 ，Ne 在 第 一 个 子 串 上 模拟 Ni No 不 确定 地 分 
支 模拟 Ni 的 不 确定 性 。 在 其 中 任何 一 个 分 支 上 达到 Ni 的 接受 状态 后 ，No 在 第 二 个 子 串 上 模 
W Na 。 如 果 其 任何 一 个 分 支 达 到 No 的 接受 状态 ， 则 No 接受 。 
机 器 N. 的 算法 比较 复杂 ， 下 面 描述 其 步骤 。 
N: = “TRA w: 

1. 初始 化 两 个 输入 位 置 指 针 pi 和 ps， € p1=0,p2=0, Bl pr 和 zs 指向 第 一 个 输入 字 

符 前 面 。 
2. Æ p: 之 后 无 输入 符号 则 接受 。 
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3. 向 前 移动 pz ， 非 确定 地 选择 一 个 输入 位 置 。 

4. 在 pi 和 pz 之 间 的 子 串 上 模拟 Ni ， 分 支 不 确定 地 模拟 Ni 的 不 确定 性 。 

5. 若 模拟 的 这 个 分 支 达 到 了 Ni 的 接受 状态 ， 则 令 入 三 加 ， 返 回 步骤 2。 如 果 Ni 在 这 
个 分 支 上 拒绝 ， 则 拒绝 。” 

8.23 将 PATH 归 约 到 CYCLE。 归 约 的 思路 是 通过 在 图 G 上 添加 一 条 从 t 到 s 的 边 ， 从 而 修改 
PATH 问题 的 例子 〈G,st)。 若 在 G 中 存在 一 条 从 s 到 t 的 路 径 ， 那 么 在 修改 后 的 G 中 就 存在 
一 个 有 向 回路 。 因 为 在 修改 前 的 G 中 或 许 已 经 存在 其 他 回路 ， 所 以 在 修改 后 的 G 中 除了 从 s 到 
t 的 回路 外 ， 有 可 能 存在 其 他 回路 。 为 了 解决 这 个 问题 ， 首 先 要 修改 G， 使 之 不 包含 回路 。 引 入 
分 级 有 向 图 (leveled directed graph) 的 概念 ， 分 级 有 向 图 中 的 结 点 被 分 成 多 个 组 : Al ,A ，…， 
A:， 每 个 组 称 为 一 个 级 ， 只 有 从 某 级 指向 比 本 级 高 一 级 的 边 才 是 允许 的 。 分 级 有 问 图 中 是 没有 
回路 的 。 对 于 分 级 有 向 图 来 说 ， 根 据 下 面 给 出 的 非 受 限 PATH 问题 的 归 约 ， 可知 PATH 问题 
仍 是 NL 完全 的 。 给 定 一 个 包含 m 个 结 点 的 有 向 图 G 以 及 结 点 s 和 t+， 产生 一 个 分 级 有 向 图 G ， 
该 图 中 的 级 是 G 中 结 点 的 m 个 拷贝 。 如 果 G 中 包含 从 结 点 到 7 的 边 ， 则 从 每 级 的 i 到 下 一 级 
的 7 画 一 条 边 。 除 此 之 外 ， 在 每 级 的 i 到 下 一 级 的 i 之 间 画 一 条 边 。 令 s 是 :在 第 一 级 的 对 应 结 
Ao lEt 在 最 后 一 级 的 对 应 结 点 。 图 G 包 含 从 s 到 上 的 路 径 当 且 仅 当 G 包含 从 * Bt 的 路 径 。 
如 果 修 改 G ， 在 其 中 增加 一 条 从 # 到 s 的 边 ， 则 得 到 了 从 PATH 到 CYCLE 的 归 约 。 这 个 归 约 
计算 是 很 简单 的 ， 并 且 其 完成 只 需要 对 数 空 间 。 更 进一步 说 ， 一 个 直观 的 过 程 证 明了 CYCLEE 
NL。 综 上 所 述 ，CYCLE 是 NL 完全 的 。 
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难 解 性 





某 些 计算 问题 在 理论 上 虽然 是 可 解 的， 但 是 获得 其 解 需 要 耗费 大 量 的 时 间或 空间 ， 导 
致 其 难以 在 实践 中 得 到 应 用 ， 这 样 的 问题 称 为 难 解 的 〈intractable) 。 

在 第 7、8 章 中 ， 介 绍 了 几 个 被 认为 是 难 解 的 问题 ， 但 是 还 没有 一 个 得 到 证 明 。 例 如 ， 
虽然 还 不 知道 怎样 证 明 ， 但 大 多 数 人 相信 SAT 问题 和 其 他 所 有 NP 完全 问题 都 是 难 解 的 。 
本 章 给 出 几 个 能 够 被 证 明 是 难 解 的 问题 。 

为 了 给 出 这 些 例子 ， 先 证 明 几 个 定理 ， 将 图 灵机 的 能 力 与 计算 可 获得 的 时 间或 空间 数 
量 关联 起 来 。 在 本 章 的 最 后 ， 进 一 步 讨论 了 证 明 NP 中 的 问题 是 难 解 的 可 能 性 ， 也 就 是 解 
决 P 问题 与 NP 问题 的 可 能 性 。 首 先 ， 介绍 相对 化 技术 ， 利 用 它 来 证 明 采 用 某 些 方法 并 不 
会 达到 这 一 目标 。 然 后 ， 讨 论 一 种 被 研究 者 采用 并 已 显示 出 一 定 前 景 的 方法 一 一 电路 复杂 
性 理论 。 

9. 1 层次 定理 

通常 的 直觉 是 ， 给 图 灵机 更 多 的 时 间或 空间 就 能 扩大 它 所 能 求解 的 问题 类 。 例 如 ， 在 
时 间 n? A, RRELA AE HERE oe? 内 判定 更 多 的 语言 。 层 次 定理 (hierarchy theorem) 
证 明了 这 种 直觉 在 满足 某 些 条 件 下 的 正确 性 。 采 用 术语 层次 定理 ， 是 因为 这 些 定理 中 的 每 
一 个 都 证 明了 时 间 和 空间 复杂 性 类 不 全 相同 一 一 它们 形成 一 个 层次 结构 ， 其 中 时 空 界限 较 
大 的 类 比 时空 界 限 较 小 的 类 包含 更 多 的 语言 。 

空间 复杂 性 层次 定理 比 时 间 复 杂 性 层次 定理 稍 简单 一 些 ， 故 首先 介绍 它 。 在 实际 陈述 
定理 之 前 ， 引 和 下面 的 定义 。 

对 于 函数 f:N>N, HP f(n) 至 少 为 OClogn), wR Ak fil 映射 为 
f(r) 的 二 进 制 表 示 ， 并 且 该 函数 在 空间 OSM) 内 是 可 计算 的 9 ， 则 称 该 函数 为 空间 可 
构造 的 〈space constructible), 

换言之 ， 如 果 存 在 某 个 图 灵机 在 O(f(n)〉 空间 内 运行 ， 而 且 在 输入 1” 时 总 能 停机 ， 
停机 时 fl(n) 的 二 进 制 表示 出 现在 带子 上 ， 则 f 是 空间 可 构造 的 。 为 了 具备 时 间 和 空间 可 
构造 性 ， 如 n logzn 和 vn 这 一 类 带 小 数 的 函数 被 向 下 舍 和 人 到 紧邻 的 较 小 的 整数 上 .。 

通常 出 现 的 复杂 度 至 少 为 O(logn) 的 函数 都 是 空间 可 构造 的 ， 包 括 logzm， 
n logon Fil n? 。 

例如 ，n? 是 空间 可 构造 的 ， 因 为 机 器 以 1 为 输入 ， 通 过 数 1 的 数目 得 到 的 二 进 制 
形式 ， 采 用 标准 的 方法 将 n AR, Mi n? 。 全 部 空间 消耗 是 O(z) ， 当 然 也 是 O(n?)。 

当 证 明 等 于 ol(n) 的 函数 f(n) 是 空间 可 构造 的 时 ， 如 同 在 8.4 节 定 义 亚 线 性 空间 复 
杂 性 那样 ， 有 一 条 单独 的 只 读 输入 带 。 例 如 ， 这 种 机 器 可 以 如 下 计算 把 1" 映射 为 logzn 的 





O KR, 的 意思 是 n 个 1 的 字符 串 。 
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1 的 数目 。 然 后 ， 因 为 n 以 二 进 制 形式 放 在 工作 带 上 ， 故 它 通过 数 n 的 二 进 制 表 示 中 的 位 
数 可 以 计算 出 logzn。 a 

从 下 面 的 讨论 中 可 以 理解 空间 可 构造 性 在 空间 层次 定理 中 的 作用 。 若 f(n) 和 g) 
是 两 个 空间 界限 ，f(n) MH gin) 大 ， 则 机 器 在 fr) 空间 内 所 能 判定 的 语言 比 在 
g(n) 空 间 内 多 。 然 而 ,假如 f(n) 超过 g(z) 的 那 部 分 数量 非常 小 而 且 难 以 计算 ， 那么 机 
器 可 能 无 法 有 效 地 利用 多 出 来 的 那 部 分 空间 ， 因 为 仅 是 计算 多 出 来 的 空间 数量 所 需 消耗 的 
空间 就 可 能 比 所 获得 的 空间 还 要 多 。 在 这 种 情况 下 ， 机 器 在 f(n) 空间 内 所 能 计算 的 语言 
不 会 比 在 g(n) 空间 内 更 多 。 规 定 f(n) 是 空间 可 构造 的 就 可 避免 这 种 情况 ， 这 样 就 可 以 
证 明 ， 机 需 所 能 计算 的 语言 比 它 在 任何 渐 近 更 小 的 界限 内 所 能 计算 的 语言 更 多 ， 如 下 面 的 
定理 所 示 。 

空间 层次 定理 ) 对 于 任何 空间 可 构造 函数 f:N 一 N， 存 在 语言 A， 在 空 
间 O(f(n)) 内 可 判定 ， 但 不 能 在 空间 o(f(n)) KAR. 

证 明 思路 ”必须 说 明 一 个 语言 A 具有 两 个 性 质 : 第 一 ，A 在 O(f(n)) 空间 内 可 判定 ， 
第 二 ，A 不 能 在 o(f(n)) 空间 内 判定 。 

通过 给 出 判定 算法 DD 来 描述 A。 算 法 DD 将 在 O(f(n))) 空间 内 运行 ， 从 而 保证 了 第 
一 个 性 质 。 进 而 ， 将 保证 A 不 同 于 任何 在 o(f(n)) 空间 内 可 判定 的 语言 ， 从 而 保证 了 
第 二 个 性 质 。 不 要 指望 语言 A 能 够 像 迄 今 为 止 本 书 中 介绍 的 其 他 语言 那样 ， 有 一 幅 简 单 明 
了 的 图 像 。 语 言 A 只 能 通过 算法 来 描述 ， 没 有 更 简单 的 、 非 算法 的 定义 。 

为 保证 A 不 能 在 o(f(n)) 空间 内 判定 ， 设 计 用 以 实现 定理 4.9 中 证 明 接 受 问 题 
AT 不可解 时 所 采用 的 对 角 线 法 。 如 果 M 是 在 oC(f(n)) 空间 内 判定 一 个 语言 的 图 灵机 ， 
W DIEA 与 M 的 语言 至 少 存在 一 点 不 同 的 地 方 。 是 哪个 地 方 ? 就 是 对 应 于 描述 M 自己 
的 地 方 。 

看 一 看 D 的 运算 方式 。 简 单 地 讲 ，D 把 它 的 输入 看 作 是 图 灵机 M 的 描述 。( 如 果 输 入 
不 是 任何 图 灵机 的 描述 ， 则 DD 在 该 输入 上 的 动作 是 无 意义 的 ， 所 以 武断 地 让 D 拒绝 即 
可 。) 然后 DD 在 同一 输入 ( 即 (M)) 上 在 空间 界限 f(n) 内 运行 M。 如 果 M 在 这 么 大 空 
间 内 停机 ， 则 接受 当 且 仅 当 M 拒绝 。 如 果 M 不 停机 ， 则 D 拒绝 。 所 以 如 果 M 在 空间 
fr) 内 运行 ， 则 DD 有 是 够 的 空间 保证 它 的 语言 不 同 于 M 的 语言 。 否 则 ，D 没有 足够 的 空 
间 算 出 M 的 结果 。 但 幸运 的 是 ， 并 没有 要 求 D 的 行为 与 不 能 在 o(f(n)) 空间 内 运行 的 机 
器 不 同 ， 所 以 D 在 该 输入 上 的 动作 是 无 关 紧 要 的 。 

该 描述 抓 住 了 证 明 的 本 质 ， 但 忽略 了 几 个 重要 的 细节 。 如 果 M 在 o(f(n)) 空间 内 运 
行 ， 则 必须 保证 它 的 语言 不 同 于 M 的 语言 。 但 是 即使 M 在 o(f(n)) 空间 内 运行 ， 它 也 
可 能 对 于 小 的 n 消耗 比 f(n) 多 的 空间 ， 只 要 这 种 渐 近 行为 还 没有 “消亡 ”，D 就 有 可 能 
没有 足够 的 空间 在 输入 〈M》 上 把 M 运行 完 ， 从 而 使 D 失去 一 次 避 开 M 的 语言 的 机 会 。 
于 是 ， 一 不 小 心 ， 就 可 能 与 M 判定 同一 语言 ， 从 而 定理 无 法 得 证 。 

通过 修改 D， 给 它 另 外 的 机 会 来 避 开 M 的 语言 可 以 弥补 这 一 问题 。 不 是 只 在 D 收 到 
WA (M) 时 才 运 行 M， 而 是 只 要 收 到 形式 为 《My 10* WA, ME (M) AERE 
一 个 1 和 一 些 0 的 输入 ， 就 运行 M。 那 么 ， 如 果 M BAU o(f(m)) 空间 内 运行 ， 则 由 于 渐 
近 行 为 最 终 肯 定 是 要 消亡 的 ， 所 以 对 于 某 个 大 的 & 值 ， 将 有 足够 的 空间 在 输入 (M)1 上 
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把 M 运行 完 。 

最 后 一 个 技术 问题 是 ， 当 DD 在 某 个 字符 串 上 运行 M 时 ，M 可 能 陷入 死 循环 而 占用 有 
穷 空 间 。 但 是 D 应 该 是 一 个 判定 机 ， 所 以 必须 保证 D 在 模拟 MM 时 不 会 循环 。 任 何在 空间 
o(f(n)) 内 运行 的 机 器 只 消耗 2° AT. MD, HEMRARW M 中 用 掉 的 步 数 。 
如 果 计 数 超 过 25%, WM) D 拒绝 。 

证 明 下 面 的 OC(f(n)) 空间 算法 D 判定 的 语言 A 不 能 在 oC(f(n)) 空间 内 判定 。 

万 一 “对 输入 w: 

l. 令 n 是 w 的 长 度 。 

2. 利用 空间 可 构造 性 计算 f(n)， 并 划分 出 这 么 多 带子 空间 。 如 果 后 面 的 步骤 企 
图 使 用 更 多 的 空间 ， 就 拒绝 。 

3. WR 也 不 是 形 如 〈M)?10* ， 其 中 M 是 某 个 图 灵机 ， 则 拒绝 。 

4. 在 w 上 模拟 M， 同 时 计算 模拟 过 程 中 使 用 的 步 数 。 如 果 计 数 超过 2/”， 则 拒绝 。 

5. 知 M 接受 ， 则 拒绝 。 若 M 拒绝 ， 则 接受 ”。 

在 步骤 4， 为 了 确定 消耗 的 空间 数量 ， 需 要 给 出 补充 的 模拟 细节 。 被 模拟 的 机 第 MA 
任意 的 带子 字母 表 ， 而 DD 有 固定 的 带子 字母 表 。 所 以 用 D 的 带子 上 的 几 个 单元 来 表示 M 
的 带子 上 的 一 个 单元 。 因 此 模拟 过 程 在 消耗 的 空间 上 增加 了 一 个 常数 倍 的 开销 。 换 言 之 ， 如 
RME gn) 空间 内 运行 ， 那 么 卫 需 要 dg(n) 空间 来 模拟 M， 其 中 4 是 依赖 于 M 的 常数 。 

D 的 每 一 步 都 在 有 限时 间 内 运行 ， 所 以 D 是 一 个 判定 机 。 设 A 是 D 判定 的 语言 。 显 
然 ， 因 为 D 的 缘故 ，A 是 在 空间 0O(f(n)) 内 可 判定 的 。 下 面 ， 证明 A 不 是 在 oC(f(n)) 空 
间 内 可 判定 的 。 

假定 其 反面 成 立 ， 即 某 个 图 灵机 M 在 空间 gí) WIE A, H gin) SF o(f(m)). 
如 前 面 所 提 ，D 可 以 在 空间 dg(n) 内 模拟 M， 其 中 4 是 某 个 常数 。 因 为 g(n) SF olf), 
所 以 存在 某 个 常数 n。， 使 得 dg(n) 二 fl(n) 对 所 有 n>n 成 立 。 因 此 只 要 输入 的 长 度 不 小 
Fns, DX M 的 模拟 就 能 运行 完 。 考 虑 DD 在 输入 《M10% 上 运行 时 的 情况 。 该 输入 比 
no 长 ， 所 以 第 4 步 的 模拟 可 以 完成 。 因 此 D 与 M 在 同一 输入 上 的 判定 结果 相反 。 于 是 M 
不 判定 A ， 这 与 假设 矛盾 。 所 以 A 不 是 在 o(f(n)) 空间 内 可 判定 的 。 a 

对 于 任意 两 个 函数 fi, foiNoN, EP f1(n) Fon), fo 是 空间 
可 构造 的 ， 有 SPACE(fi(n))& SPACE( f2(n))® 。 

该 推论 允许 把 不 同 的 空间 复杂 性 类 彼此 分 开 。 人 例如， 容易 证 明 对 于 任何 自然 数 c， 函 数 
n 是 空间 可 构造 的 。 因 此 对 于 任意 两 个 自然 数 cl 二 c2 ， 可 以 证 明 SPACE(m )G SPACE(n® ) 。 
再 做 一 点 努力 就 可 以 证 明 对 于 任何 有 理 数 c>, n 是 空间 可 构造 的 ， 从 而 把 前 面 的 包含 
关系 推广 到 对 任何 有 理 数 0 过 ci 二 cz 都 成 立 。 注 意 到 在 任何 两 个 实数 sl 二 ez 之 间 总 存在 两 
个 有 理 数 cl 和 co 使 得 e 二 ci 二 cz 二 ez 。 于 是 得 到 下 面 补充 的 推论 ， 它 表明 在 PSPACE 类 
中 存在 一 个 良好 的 层次 结构 。 

对 于 任意 两 个 实数 0<el <e, A 

SPACE(n: ) & SPACE(ns:) 
也 可 以 用 空间 层次 定理 来 分 离 前 面 碰 到 的 两 个 空间 复杂 性 类 。 


© 回忆 一 下 A$B 表示 A 是 B 的 真子 集 。 
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NL & PSPACE. 

证 明 萨 维 奇 定理 说 明 NLC SPACE (log?n)， 空 间 层 次 定理 说 明 SPACE (log?n)G 
SPACE(n)， 所 以 推论 成 立 。 = 

正如 在 8.5 节 末 所 说 的 那样 ， 就 对 数 空 间 可 归 约 性 而 言 ，TQBF 是 PSPACE 完全 的 ， 
所 以 TQBFENL. 

现在 建立 本 章 的 主要 目标 : 证 明 存 在 理论 上 可 判定 而 实际 中 不 可 判定 的 问题 ， 即 可 
判定 而 难 解 的 问题 。 每 一 个 类 SPACE(n*) 包含 在 类 SPACE(nee*) 中 ， 后 者 又 严格 包 
含 在 类 SPACE(2") 中 。 所 以 得 到 下 面 补充 的 推论 ， 把 PSPACE 与 EXPSPACE= U, 
SPACE(2” ) 分 开 。 

PSPACE Ç EXPSPACE。 

就 判定 过 程 必须 消耗 多 于 多 项 式 的 空间 这 一 意义 而 言 ， 该 推论 证 明 存在 难 解 的 但 可 判 
定 的 问题 。 语 言 本 身 有 一 些 不 太 自 然 一 一 它们 只 是 为 了 分 离 复 杂 性 类 才 有 意义 。 在 讨论 时 
间 层 次 定理 以 后 ， 利 用 这 些 语言 来 证 明 其 他 更 加 自然 的 语言 的 难 解 性 。 

对 于 函数 t:N>N, HP t(n) 2H O(n logn), wR BAI 1" 映射 为 
t(n) 的 二 进 制 表示 ， 并 在 时 间 O(ti(n)) 内 可 计算 ， 则 称 该 函数 为 时 间 可 构造 的 〈time 
constructible) 。 

换言之 ， 如 果 存 在 某 个 图 灵机 ， 在 时 间 OG) 内 运行 ， 而 且 在 输入 1" 上 启动 后 总 
能 停机 ， 停 机 时 上 zz) 的 二 进 制 表示 出 现在 带子 上 ， 则 上 是 时 间 可 构造 的 。 

通常 出 现 的 不 小 于 nlogn 的 函数 都 是 时 间 可 构造 的 ， 包 括 函 数 nlogn，n Vn ， 
n? 以 及 2". 

例如 ， 为 了 证 明 nyn 是 时 间 可 构造 的 ， 首 先 设 计 一 个 图 灵机 ， 以 二 进 制 计算 1 的 个 
数 。 为 此 该 图 灵机 沿 着 带子 移动 一 个 二 进 制 计数 器 ， 每 到 一 个 输入 位 置 就 把 它 加 1， 直 至 
输入 的 末端 。 因 为 对 于 个 输入 位 置 的 每 一 个 都 需要 消耗 O(logz) 步 ， 所 以 这 部 分 工作 消 
# O(n logn) 步 。 然 后 ， 从 nn 的 二 进 制 表 示 中 计算 出 Ln vn | 的 二 进 制 形式 。 因 为 涉及 的 数 
的 长 度 是 O(logn)， 所 以 任何 合理 的 计算 方法 都 将 消耗 Olnlogn) 时 间 。 a 

时 间 层 次 定理 是 定理 9. 3 相对 于 时 间 复 杂 性 的 类 似 定 理 。 因 为 在 证 明 中 出 现 的 技术 上 
的 缘故 ， 时 间 层 次 定理 比 已 证 明 的 空间 层次 定理 稍 弱 。 任 何 空间 可 构造 的 空间 界限 的 渐 近 
增加 都 将 扩大 可 判定 的 语言 类 。 与 之 不 同 ， 对 于 时 间 ， 为 了 保证 获得 更 多 的 语言 ， 必 须 进 
一 步 把 时 间 界 限 扩大 一 个 对 数 倍 才 行 。 可 以 想象 ， 更 紧 的 时 间 层 次 定理 也 成 立 ， 但 是 目前 
还 不 知道 怎样 证 明 它 。 时 间 层 次 定理 具有 这 一 特点 是 因为 我 们 用 单 带 图 灵机 度量 时 间 复 杂 
性 。 可 以 对 其 他 计算 模型 证 明 更 紧 的 时 间 层 次 定理 。 

(时 间 层 次 定理 ) 对 于 任何 时 间 可 构造 函数 NN, HEEE A, Ai 
间 OCt(n)) ATH, LM o(t(n)/logt(n)) 内 不 可 判定 。 

证 明 思 路 ”本 和 定理 的 证 明 类 似 于 定理 9.3 的 证 明 。 构 造 一 个 图 灵机 D 在 时 间 OCz(z)) 
内 判定 语言 A， 而 A 不 能 在 时 间 o(¢(n)/logt(n)) 内 被 判定 。 这 里 ， 刀 读 取 一 个 形 如 〈M)710* 的 
Aw, RM 在 输入 w 上 的 运行 ， 确 保 时 间 消耗 不 超过 tln)。 如 果 M 停机 的 时 间 在 这 
之 内 ， 则 DD 给 出 相反 的 输出 。 

证 明 中 重要 的 差别 涉及 模拟 M 的 开销 以 及 计算 模拟 所 使 用 的 步 数 的 开销 。 机 器 DY 


须 有 效 地 执行 这 种 定时 的 模拟 ， 以 使 DD 在 时 间 O Ct (n)) 内 运行 的 同时 ， 避 开 所 有 在 
o(t(n)/logt(n)) 时 间 内 可 判定 的 语言 。 对 于 空间 复杂 性 ， 正 如 在 定理 9.3 的 证 明 中 所 注 
意 到 的 ， 这 种 模拟 增加 了 一 个 常数 倍 的 开销 。 对 于 时 间 复 杂 性 ， 这 种 模拟 增加 一 个 对 数 倍 
的 开销 。 时 间 需 要 更 大 的 开销 是 因为 在 本 和 定理 陈述 中 出 现 了 1/logt(n) 因子 。 假 如 有 一 种 
办 法 用 一 台 单 带 图 灵机 模拟 另 一 台 单 带 图 灵机 运行 预先 设 定 的 步 数 ， 而 在 时 间 上 只 增加 常 
数 倍 开销 ， 我 们 就 可 以 加 强 本 定理 ， 把 ol(t(n)/logt(n)) 变 为 ol(t(n))。 但 是 尚 不 知道 如 此 
高 效率 的 模拟 。 
证 明 FER OG) 时 间 算 法 D 所 判定 的 语言 A 不 是 在 o(t(n)/logt(n)) 时 间 内 
可 判定 的 。 
站 一“ 对 输入 w: 
lL. SGn#whkE. 
2. 利用 时 间 可 构造 性 计算 i:(n)， 把 值 [i(n)/log(n)| 存 放 在 一 个 二 进 制 计数 器 中 。 
在 每 一 次 执行 步骤 4、5 之 前 ， 把 该 计数 器 减 ] 。 pn a 就 拒绝 。 
3. 奉 世 的 形式 不 是 (M?10* ， 其 中 M 是 某 个 图 灵机 ， 则 拒绝 。 
4. 在 w 上 模拟 MM。 
5. 若 M 接受 ， 则 拒绝 ; AM 拒绝 ， 则 接受 。” 
考察 该 算法 的 每 一 步 以 确定 运行 时 间 。 步 骤 1、2、3 能 够 在 Ol(i(n)) 时 间 内 完成 。 
在 步骤 4， 每 次 D 模拟 M 的 一 步 ， 它 都 要 读 取 M 的 当前 状态 以 及 M 读 写 头 下 的 带子 
符号 ， 在 M 的 转移 函数 中 查找 M 的 下 一 个 动作 ， 以 使 它 能 够 适当 地 更 新 M 的 市 子 内 容 。 
所 有 这 三 个 对 象 状态、 带子 符号 和 转移 函数 ) 都 存放 在 D 的 带子 上 的 菜 处 。 如 果 它 们 彼 
此 分 开 很 远 ， 则 D 每 次 模拟 M 的 一 步 都 需要 走 许多 步 来 收集 这 些 信 息 。 所 以 ，D 总 是 把 
这 些 信息 放 在 一 起 。 
可 以 把 DD 的 单 带 组 织 成 轨道 。 得 到 两 条 轨道 的 一 种 方法 是 以 奇数 位 置 存 储 一 条 轨道 ， 
以 偶数 位 置 存 储 另 一 条 轨道 。 另 一 种 获得 两 条 轨道 效果 的 方法 是 扩大 的 市 子 字母 表 ， 使 
它 包括 每 一 对 符号 : 一 个 符号 来 自 上 轨道 ， 另 一 个 符号 来 自 下 轨道 。 更 多 的 轨道 效果 也 可 
以 类 似 获得 。 注 意 ， 如 果 只 使 用 固定 数目 个 轨道 ， 多 轨道 就 只 增加 一 个 常数 倍 的 时 间 开 
销 。 这 里 ，DD 采 用 三 条 轨道 。 
第 一 条 轨道 存储 M 的 带子 内 容 ， 第 二 条 轨道 包含 M 的 当前 状态 和 转移 函数 的 副本 。 
在 模拟 过 程 中 ，D 将 信息 保持 在 第 二 条 轨道 上 ， 靠 近 第 一 条 轨道 上 M 的 读 写 头 的 当前 位 
置 。 每 次 M 移动 读 写 头 时 ,DD 搬 动 第 二 条 轨道 上 的 所 有 内 容 ， 使 它 靠近 该 读 写 头 。 第 二 
条 轨道 上 信息 的 长 度 仅 依赖 于 M， 而 不 依赖 于 M 的 输入 的 长 度 ， 所 以 搬 动 操作 只 使 模拟 
时 间 增 加 常数 倍 。 进 一 步 讲 ， 所 需 的 信息 都 靠 得 很 近 ， 所 以 在 转移 函数 中 查找 M 的 下 一 
个 动作 并 更 新 带子 内 容 的 开销 就 只 是 个 常数 。 因 此 ， 如 果 M 在 g(n) 时 间 内 运行 ，D 就 能 
在 O(g(n)) 时 间 内 模拟 它 。 
在 步骤 4 的 每 一 步 ，D 必须 把 原先 在 步骤 2 中 设置 的 步 数 计数 器 减 1。 这 里 ，D 可 以 
在 不 显著 增加 模拟 时 间 的 条 件 下 完成 这 一 操作 ， 这 只 需 把 二 进 制 计 数 器 存放 在 第 三 条 轨道 
上 ， 并 使 它 保持 靠近 当前 读 写 头 的 位 置 。 该 计数 器 的 量 值 大 约 是 i(n)/logi(n)， 所 以 它 的 
KEE log(t(n)/logt(n)), Bl O(logt(n))。 因 此 在 每 一 步 ， 更 新 和 移动 它 给 模拟 时 间 增 加 
i(n) /logt(n) 倍 的 开销 ， 于 是 使 得 全 部 运行 时 间 达 到 O(z(n))。 所 以 A 是 OC(t(n)) HAA 
可 判定 的 。 
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为 了 证 明 A Adz o(t(n)/logt(n)) 时 间 内 可 判定 的 ， 采 用 类 似 于 定理 9. 3 的 证 明 中 所 
使 用 的 推理 。 假 定 其 反面 成 立 ， 即 存在 图 灵机 M 在 时 间 g(a) WAEA, B glin) 等 于 
0(t(n)/logt(n))。 这 里 ，D 能 够 在 时 间 dg (n) 内 模拟 M, 其 中 4 是 某 个 常数 。 如 果 全 部 模 
拟 时 间 (A LG ERT BEAT IB) 最 多 是 i:(n)/logi(n)， 则 模拟 过 程 可 以 完成 。 
H gn) 等 于 olt(n)/logt(n))， 所 以 存在 某 个 常数 no ， 使 得 对 nm, dg(n)<t(n)/logt(n). 
因此 只 要 输入 的 长 度 不 小 于 n, D 对 M 的 模拟 就 可 以 完成 。 考 虑 DD 在 输入 《IM)10% 上 运行 
时 发 生 的 情况 。 该 输入 比 no 长 ， 所 以 步骤 4 的 模拟 过 程 可 以 完成 。 因 此 D 与 M 在 同一 输入 
上 的 判定 结果 相反 ， 于 是 M 不 判定 A， 这 与 假设 矛盾 。 所 以 A 不 是 时 间 o(t(n)/logt(n)) 内 
可 判定 的 。 a 

对 时 间 复 杂 性 建立 类 似 于 推论 9.4，9.5 和 9.7 的 推论 。 

xt FER A BH ti ,te:N>N, HP ti (n) # F o(t2(n)/logts(n)) 而 
Et HATH, A TIME (n))S TIMECt: (n))。 

对 于 任意 两 个 实数 1 和 sl <e, A TIME (ns )G TIME(n® ) 。 

PG EXPTIME, 
指数 空间 完全 性 

利用 前 面 的 结果 ， 可 以 证 明 一 个 具体 的 语言 事实 上 是 难 解 的 。 证 明 过 程 分 成 两 步 。 首 
先 ， 层 次 定理 说 明 图 灵机 在 EXPSPACE 内 比 在 PSPACE 内 判定 更 多 的 语言 。 然 后 ， 证 明 
有 关 广 义 正 则 表达 式 的 一 个 具体 的 语言 是 EXPSPACE 完全 的 ， 因 此 不 能 在 多 项 式 时 间 内 
(其 至 不 能 在 多 项 式 空间 内 ) 判定 。 

在 推广 正则 表达 式 之 前 ， 先 简要 回顾 一 下 定义 1. 26 中 正则 表达 式 的 定义 。 它 们 是 从 
原子 表达 式 名 ，e 以 及 字母 表 中 的 符号 出 发 ， 通 过 运用 正则 运算 构造 起 来 的 。 这 些 正则 运 
算 包 括 并 、 连 接 和 星 号 ， 分 别 用 U ,。 和 x 表示。 从 问题 8. 24 可知， 可 以 在 多 项 式 空间 内 
判定 两 个 正则 表达 式 的 等 价 性 。 

下 边 将 证 明 ， 如 果 人 允许 正则 表达 式 采 用 比 通常 的 正则 运算 更 多 的 运算 ， 则 分 析 表 达 式 的 
复杂 性 将 急剧 上 升 。 设 个 是 指数 运算 (exponentiation operation), # R 是 一 个 正则 表达 式 ，& 
是 一 个 非 负 整数 ， 则 写法 RARSHFRABERRMK. HOE RARPABAR. HAZ, 


ee 
Rt = RAR=RoRo- oR 

广义 正则 表达 式 允 许 指 数 运算 ， 也 人 允许 通常 的 正则 运算 。 显 然 ， 广 义 正则 表达 式 仍 然 

产生 正则 语言 ， 跟 标准 正则 表达 式 一 样 。 通 过 重复 基本 的 正则 运算 表达 式 ， 可 以 除去 指数 
FQrexs = ((Q,R) | Q 和 尺 是 等 价 的 带 指数 运算 的 正则 表达 式 } 

为 了 证 明 EQREx+ 是 难 解 的 ， 可 以 证 明 它 对 于 类 EXPSPACE 是 完全 的 。 任 何 
EXPSPACE 完 全 问题 都 不 可 能 在 PSPACE 中 ， 更 不 用 说 P 了。 否则 EXPSPACE 将 等 于 
PSPACE, 与 推论 9.7 矛盾 。 

语言 B 是 EXPSPACE 完全 的 ， 如 果 

1. BEEXPSPACE， 并 且 

2. EXPSPACE 中 的 每 个 A 都 多 项 式 时 间 可 归 约 到 B。 
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EQrEx+ 是 EXPSPACE 完全 的 。 

证 明 思 路 ”在 度量 EQrEx+ 的 复杂 性 时 ， 假定 所 有 指数 都 写成 二 进 制 整 数 。 表 达 式 的 
长 度 是 它 包 含 的 所 有 符号 的 总 数 。 

接 下 来 概略 地 叙述 判定 EQrex+ 的 EXPSPACE 算法 。 为 了 判定 两 个 带 指数 的 表达 式 
是 否 等 价 ， 首 先 用 重复 表达 式 的 办 法 删除 指数 ， 然 后 把 得 到 的 表达 式 转 化 为 NFA。 最 后 
再 利用 一 个 类 似 于 例 8. 4 中 判定 ALLNFa 的 算法 的 NFA 等 价 性 判定 过 程 。 

为 了 证 明 EXPSPACE 中 的 语言 A 多 项 式 时 间 可 归 约 到 EQrex* ， 利 用 5.1 节 介 绍 的 
利用 计算 历史 的 归 约 技巧 ， 其 构造 类 似 于 定理 5. 10 的 证 明 中 给 出 的 构造 。 

给 定 一 个 判定 A 的 图 灵机 M ， 设 计 一 个 多 项 式 时 间 归 约 ， 把 输入 w 映射 为 一 对 表达 
AR 和 RR， 使 得 它们 等 价 当 且 仅 当 M 接受 w。 表 达 式 R AR 模拟 M 在 w 上 的 计算 。 
表达 式 Ri 产生 计算 历史 中 可 能 出 现 的 符号 组 成 的 所 有 字符 串 。 表 达 式 Re 产生 所 有 不 代表 
拒绝 计算 历史 的 字符 串 。 于 是 ， 硅 图 灵机 接受 输入 ， 就 不 会 有 拒绝 计算 历史 存在 ， 表 达 式 
Ri 和 Ro 将 产生 同一 个 语言 。 回 忆 一 下 ， 一 个 拒绝 计算 历史 就 是 机 器 在 输入 上 进入 拒绝 计 
算 的 格局 序列 。 参 见 5. 1 节 有 关 计 算 历 史 的 介绍 。 

本 证 明 的 难点 在 于 所 构造 的 表达 式 的 长 度 必 须 是 n 的 多 项 式 (以 使 归 约 能 够 在 多 项 式 
时 间 内 运算 )， 而 模拟 计算 的 长 度 可 能 是 指数 的 。 这 时 指数 运算 就 有 助 于 用 相对 短 的 表达 
式 表示 长 的 计算 。 

证 明 首先 给 出 一 个 非 确定 的 算法 ， 判 定 两 个 NFA 是 否 等 价 。 

N=“ RWAN N2), EP NM N: Æ NFA: 

1. 给 NA No 的 起 始 状态 打上 标记 。 
2. 重复 下 面 的 操作 2272, Hg, 和 9 是 Ni 和 和 as 的 状态 数 。 
3. 非 确定 地 选择 一 个 输入 符号 ， 改 变 在 Ni 和 N 的 状态 上 标记 的 位 置 ， 以 模拟 
读 人 这 个 符号 。 
4. 者 在 任何 时 刻 ， 标 记 放 在 一 个 有 穷 目 动机 的 接受 状态 上 ， 而 没有 放 在 另 一 个 有 
穷 目 动机 的 接受 状态 上 ， 则 接受 ; 否则 拒绝 。” 
如 果 目 动机 Ni 和 N 是 等 价 的 ，N 显然 拒绝 ， 因 为 它 只 在 确定 一 台 机 器 接受 某 个 串 
而 男 一 台 机 器 不 接受 时 才能 接受 。 如 果 这 两 个 自动 机 不 等 价 ， 则 存在 某 个 字符 串 被 一 台 机 
器 接受 而 不 能 被 另 一 台 接 受 。 这 样 的 字符 串 中 必定 有 长 度 不 超过 2072 的 。 若 不 然 ， 考 虑 
用 这 样 的 串 中 最 短 的 一 个 作为 非 确定 选择 的 序列 。 因 为 只 存在 207% 种 不 同 的 方式 把 标记 
ME N M N: 的 状态 上 ， 所 以 在 更 长 的 字符 串 中 标记 的 位 置 必定 重复 。 把 介 于 重复 之 间 
的 那 部 分 字符 串 删 除 ， 就 得 到 更 短 的 字符 串 。 因 此 算法 N 在 它 的 非 确定 选择 中 会 猜 到 这 
个 串 并 接受 。 所 以 六 运算 正确 。 
算法 N 在 非 确 定 线性 空间 内 运行 ， 于 是 根据 萨 维 奇 定 理 ， 可 以 得 到 判定 该 问题 的 确 
EW On) 空间 算法 。 下 面 用 该 算法 的 确定 形式 设计 判定 EQrx 的 算法 E. 
E=“ A (Ri R2), EP RA R: 是 带 指数 的 正则 表达 式 : 
1. 把 Ri A Re 转化 为 等 价 的 正则 表达 式 Bi: 和 B, HF B 和 Bo 利用 重复 代替 指数 。 
2. 利用 引 理 1. 29 的 证 明 中 给 出 的 转化 过 程 ， 把 B 和 Bo 转化 为 等 价 的 NFA Ni All N. 
3. 利用 算法 N 的 确定 版 来 判定 Ni 和 Ne 是 否 等 价 。” 

显然 算法 是 正确 的 。 为 了 分 析 它 的 空间 复杂 性 ， 注 意 到 用 重复 蔡 换 指数 的 方法 可 能 
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会 把 表达 式 的 长 度 增 加 2 倍 ， 其 中 7 是 指数 的 长 度 和 。 于 是 表达 式 BA B: 的 长 度 最 大 为 
?22 ， 其 中 是 输入 的 长 度 。 引 理 1. 29 的 转化 过 程 使 长 度 线性 增加 ， 因 此 NFA Ni 和 六。 
最 多 有 OCn2*) 个 状态 。 因 为 输入 长 度 是 O(n2*)， 所 以 算法 N 的 确定 版 消耗 空间 
O((n2")?) =O(n? 27"), FH EQrEx+ 是 指数 空间 可 判定 的 。 

下 面 证 明 EQrEx+ 是 EXPSPACE 难 的 。 设 图 灵机 M 在 空间 2° AKIRA, HP 
& 是 某 个 常数 。 归 约 把 输入 w 映射 为 一 对 正则 表达 式 R1 和 R. REA Ri we A, GA 
PP 和 Q 表示 M 的 带子 字母 表 和 状态 集 ， 则 A 二 TUQU {#) 是 计算 历史 中 可 能 出 现 的 所 有 
符号 组 成 的 字母 表 。 构 造 表达 式 Rs ， 使 它 产 生 不 代表 M Ew 上 的 拒绝 计算 历史 的 所 有 字 
FR, BR, MRSw4AN4M Ew 上 没有 拒绝 计算 历史 。 因 此 这 两 个 表达 式 等 价 当 
且 仅 当 M 接受 w。 构 造 过 程 如 下 ，。 

M 在 w 上 的 一 个 拒绝 计算 历史 是 由 符号 # 分 隔 的 一 系列 格局 。 采 用 标准 的 格局 编码 ， 
其 中 代表 当前 状态 的 符号 放 在 当前 读 写 头 位 置 的 左边 。 假 定 所 有 格局 的 长 度 为 2  ， 如 果 
长 度 不 够 ， 就 用 空白 符 填 在 右边 。 拒 绝 计算 历史 的 第 一 个 格局 是 M 在 w 上 的 初始 格局 ， 
最 未 格局 是 一 个 拒绝 格局 。 每 一 个 格局 都 必须 根据 转移 函数 中 指定 的 规则 从 前 一 个 格局 转 
变 而 来 。 

一 个 字符 串 不 代表 拒绝 计算 的 情况 可 能 有 几 种 。 或 者 它 非 正常 开始 ， 或 者 非 正常 结 
束 ， 或 者 在 中 间 某 处 不 正确 。 表 达 式 Ro 等 于 Roag- start U Road- window U Rbad_reect， 其 中 每 个 
子 表达 式 对 应 于 字符 串 不 代表 拒绝 计算 的 上 面 三 种 情况 之 一 。 

现在 构造 表达 式 Roo sar ， 使 它 产生 所 有 不 以 M 在 w 上 的 起 始 格局 C1 开头 的 字符 
串 。 格 局 Ci 形 如 qow wee swe UL UF, WAE Ci 的 每 一 部 分 ， 把 Road- start 写 成 几 个 子 
表达 式 的 并 : 

Rhamat = Oo U Si U = US, U Ss U Se 

RER So 产生 所 有 不 以 qo 开头 的 字符 串 。 令 So 是 表达 式 A_。A* 。 记 法 A-。 是 A 
中 除去 qo 以 后 ， 所 有 符号 的 并 的 简写 。 

表达 式 S 产生 所 有 第 二 个 位 置 上 不 是 w HSS. +S 是 AA-w, A。 一 般 地 讲 ， 
对 于 1 二 i<n， 表 达 式 S; 是 A A-w A* 。 于 是 S 产生 所 有 这 样 的 字符 串 ， 它 们 在 前 i 个 位 
置 上 包含 任何 字符 ， 在 位 置 i 十 1 上 包含 除 w 以 外 的 任何 字符 ， 在 位 置 i 十 1 以 后 包含 任意 
字符 串 。 注 意 ， 这 里 已 经 使 用 了 指数 运算 。 实 际 上 ， 在 这 时 候 指 数 运算 只 是 为 了 方便 ， 而 
不 是 必需 的 ， 因 为 本 来 可 以 把 符号 A 重复 i 次， 而 不 会 过 度 地 增加 表达 式 的 长 度 。 但 是 在 
下 面 的 子 表达 式 中 ， 指 数 运算 对 于 把 长 度 保持 在 多 项 式 内 就 起 决定 性 作用 了 。 

表达 式 Sb 产生 所 有 在 nn 十 2 到 2 ) 的 某 个 位 置 上 不 包含 空白 符 的 字符 串 。 为 此 本 来 可 
以 引进 子 表达 式 S,+* 直 到 Soo ， 但 是 那样 做 将 会 使 表达 式 Road- start 的 长 度 为 指数 。 改 令 

Se = Ar (A Ue)? A LIA’ 
于 是 Sy* 产 生 的 字符 串 在 前 ”十 1 个 位 置 包 含 任何 字符 ， 在 接 下 来 的 t 个 位 置 也 包含 任何 字 
符 ， 其 中 t 也 可 以 从 0 到 2 一 n 一 2， 再 下 一 个 位 置 包 含 除 空白 符 以 外 的 任何 字符 。 
BUG, Sx 产生 所 有 在 位 置 20 十 1 上 不 包含 符号 # 的 字符 串 。 令 S# 是 A*” A-# A* 。 


前 边 已 经 完成 了 Rbad- start 的 构造 ， 现在 开始 下 一 部 分 pad- reject è 它 产生 所 有 非 正 常 结 
束 的 字符 串 ， 即 不 包含 拒绝 格局 的 字符 串 。 任 何 拒绝 格局 都 包含 状态 reject MAS 


Rbad- reject = A*g...., 
于 是 Rbaq-reject 产 生 所 有 不 含 reject HY FFF AB 
最 后 构造 表达 式 Road- window， 使 它 产生 所 有 这 样 的 字符 串 : 其 中 的 一 个 格局 不 能 正确 
地 转变 为 下 一 个 格局 。 回 忆 一 下 ， 在 库 克 - 列 文 定 理 的 证 明 中 ， 只 要 第 一 个 格局 的 每 三 个 
连续 符号 都 能 根据 转移 函数 正确 地 产生 第 二 个 格局 的 相应 的 三 个 符号 ， 就 判定 第 一 个 格局 
合法 地 产生 第 二 个 格局 。 所 以 ， 如 果 一 个 格局 不 能 产生 另 一 个 格局 ， 通 过 考察 适当 的 六 个 
符号 就 能 使 错误 显现 出 来 。 采 用 这 种 思想 来 构造 Rpad- window : 


Cnt) 
Rhad- window 一 U A” abe AM “ap def A j 
bad(abc , def) 


其 中 bad(abc,def) 的 意思 是 根据 转移 函数 abe 不 能 生成 def 。 并 运算 只 是 对 A 中 这 样 的 
符号 a,b,c,d,e,f 进行 的 。 图 9- 1 显示 了 在 一 个 计算 历史 中 这 些 符号 的 位 置 。 
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i i+] 
gee [#] ~ Jaļlbļje| i |#| -~~ [adlelf| -~ lal 3 


2092 


图 9-1 相 邻 格局 的 对 应 位 置 


为 了 计算 R: 的 长 度 ， 确 定 出 现在 其 中 的 指数 的 长 度 。 其 中 出 现 了 几 个 量 级 大 约 为 
20 ) 的 指数 ， 它 们 的 二 进 制 总 长 为 O), KE R 的 长 度 是 MAR. z 


9.2 相对 化 


EQrex + 难 解 性 的 证 明 依赖 于 对 角 化 法 。 为 什么 不 用 同样 的 方法 证 明 SAT 是 难 解 的 
呢 ? 或 许 ， 可 以 用 对 角 化 法 证 明 一 个 非 确定 型 多 项 式 时 间 图 灵机 能 够 判定 一 个 不 在 了 中 的 
语言 。 本 节 介 绍 相 对 化 (relativization) 方法 ， 它 给 出 有 力 的 证 据 排 除了 用 对 角 化 法 解决 
P 与 NP 问题 的 可 能 性 。 

在 相对 化 方法 中 ， 将 修改 计算 模型 ， 给 图 灵机 一 些 本 质 上 是 “免费 ”的 信息 。 依 据 实 
际 提供 给 它 的 信息 ， 图 灵机 就 可 能 比 以 前 更 轻松 地 解决 某 些 问 题 。 

例如 ， 假 定 对 任何 长 度 的 布尔 公式 ， 给 图 灵机 以 在 一 步 内 解决 可 满足 性 问题 的 能 力 。 
不 管 怎样 实现 这 一 奇迹 想象 一 个 附带 的 “黑匣子 ”给 了 机 器 这 种 能 力 。 可 以 把 这 个 黑 
匣子 称 为 论 示 ， 以 强调 它 没 必要 对 应 于 任何 物理 设备 。 显 然 ， 不 管 忆 是 否 等 于 NP， 机 器 
都 可 以 利用 诊 示 在 多 项 式 时 间 内 解决 任何 NP 问题 ， 因 为 每 一 个 NP 问题 都 可 多 项 式 时 间 
归 约 到 可 满足 性 问题 。 这 样 的 图 灵机 被 称 为 相对 于 可 满足 性 问题 进行 计算 ， 因 此 才 有 术语 
相对 化 。 

一 般 地 讲 ， 论 示 可 以 对 应 于 任何 具体 的 语言 ， 不 仅仅 是 可 满足 性 问题 。 论 示人 允许 图 灵 
机 判定 该 语言 的 成 员 资 格 ， 而 不 必 自 己 计算 出 答案 。 下 面 把 这 个 概念 简略 地 形式 化 。 读 者 
可 能 会 回忆 起 在 6. 3 节 曾 经 碰 到 过 论 示 。 那 时 ， 和 定义 它 是 为 了 根据 不 可 解 度 来 给 问题 分 
类 。 这 里 ， 利 用 论 示 是 为 了 更 好 地 理解 对 角 化 方法 的 能 力 。 

针对 一 个 语言 A 的 论 示 是 一 个 能 够 判断 任何 事 w 是 否 在 该 语言 中 的 设 
备 。 论 示 图 灵机 Coracle Turing machine) MA 就 是 在 通常 的 图 灵机 基础 上 增加 查询 A 的 论 
示 的 能 力 。 每 当 M4 在 称 为 论 示 带 (oracle tape) 的 特殊 带子 上 写 下 一 个 字符 串 时 ， 它 就 
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能 在 一 步 内 计算 得 知 这 个 字符 串 是 否 属于 A。 

令 PA 是 采用 论 示 A 的 多 项 式 时 间 论 示 图 灵机 可 判定 的 语言 类 。 类 似 地 可 以 定义 
NP4 类 。 

如 前 面 提 到 的 ， 相 对 于 可 满足 性 问题 的 多 项 式 时 间 计算 包含 了 NP 的 全 部 。 
换言之 ，NPGPsaAT 。 进 一 步 ，coNPSPsAT ， 因 为 PMT 是 一 个 确定 型 复杂 性 类 ， 在 补 运算 
下 封闭 。 

正如 PsAT 包含 不 属于 了 的 语言 一 样 。NPs4T 包含 不 属于 NP 的 语言 。 问 
题 7. 21 中 定义 的 语言 MIN-FORMULA 的 补 集 给 出 了 这 样 的 一 个 例子 。 

MIN FORMULA 似 乎 不 在 NP 中 (虽然 它 是 否 属 于 NP 还 不 知道 )。 然 而 ， 
MIN- FORMULA 属 于 NPT, KHU SAT 为 论 示 的 非 确定 型 多 项 式 时 间 论 示 图 灵机 可 
以 如 下 检查 $ 是 否 属于 它 。 首 先 ， 因 为 非 确定 型 机 器 可 以 猜测 使 两 个 布尔 公式 的 值 不 相同 
的 赋值 ， 所 以 两 个 布尔 公式 的 不 等 价 问题 是 NP 内 可 解 的 ， 从 而 等 价 问题 属于 coNP。 然 
后 ， 判 定 MIN- FORMULA 的 非 确定 型 论 示 机 器 非 确定 地 猜测 一 个 更 小 的 等 价 公式 ， 用 论 
示 SAT 来 检查 它 是 否 真 的 是 等 价 的 ， 若 是 ， 则 接受 。 可 
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下 一 个 定理 表明 存在 论 示 A 和 B， 使 得 可 以 证 明 P4 与 NP4 不 同 ， 而 Pe NPE +H N. 
这 两 个 论 示 很 重要 ， 因 为 它们 的 存在 表明 不 太 可 能 用 对 角 化 方法 解决 了 与 NP 问题 。 

对 角 化 方法 的 核心 是 一 台 图 灵机 对 另 一 台 图 灵机 的 模拟 。 模 拟 是 这 样 完成 的 : 模拟 机 
器 能 够 确定 另 一 台 机 器 的 行为 ， 从 而 以 不 同 的 方式 动作 。 假 定 给 这 两 台 机 占 以 同样 的 论 
示 ， 和 那么 每 当 被 模拟 机 器 询问 论 示 时 ， 模 拟 机 也 询问 ， 所 以 模拟 过 程 可 以 像 以 前 一 样 进行 
下 去 。 因 此 ， 凡 是 仅 用 对 角 化 方法 证 明 的 关于 图 灵机 的 定理 ， 当 给 两 台 机 器 以 相同 论 示 的 
时 候 ， 将 仍然 成 立 。 

特别 地 讲 ， 如 果 能 用 对 角 化 方法 证 明了 与 NP 不 同 ， 就 能 下 结论 说 它们 相对 于 任何 论 
示 也 是 不 同 的 。 但 是 PS5 NP3 相 等， 所 以 结论 不 成 立 。 因 此 对 角 化 方法 不 足以 分 开 这 两 
个 类 。 类 似 地 ， 依 据 简单 模拟 的 证 明 不 能 说 明 这 两 个 类 相等 ， 因 为 那 将 证 明 它 们 相对 于 任 
何 论 示 都 是 相等 的 ， 但 实际 上 P^ 与 NPA AAS. 

erp ~~ 

1. 存在 论 示 A 使 得 PAANPS, 

2. 存在 论 示 B 使 得 PB 二 NPB。 

证 明 思 路 ”展示 论 示 吾 是 容易 的 ， 只 需 令 B 是 任意 的 PSPACE 完全 问题 (如 TQBF) 
BITI. 

构造 论 示 A。 设 计 A 使 得 NP4 中 的 某 个 语言 工 4A 在 证 明 它 时 需要 蛮 力 搜索 ， 因 而 工 4 不 
可 能 属于 P4。 因 此 可 以 得 出 P4 夭 NP4 的 结论 。 构 造 过 程 依 次 考察 每 一 个 多 项 式 时 间 论 示 
机 器 ， 保 证 每 一 个 都 不 能 判定 语言 La. 

证 明 令 B 是 TQBF。 有 下 面 一 系列 包含 关系 : 

NPTQBF = NPSPACE 二 PSPACE = PTQBF 


包含 关系 1 成 立 ， 因 为 可 以 把 非 确定 型 多 项 式 时 间 论 示 机 器 转变 为 非 确定 型 多 项 式 空 间 
机 器 ， 该 机 器 不 使 用 论 示 ， 而 是 计算 出 对 TQBF 的 查询 的 答案 。 由 萨 维 奇 定 理 可 知 包含 关系 
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2 成立。 包含 关系 3 成 立 是 因为 TQBF 是 PSPACE 完全 的 。 因 此 下 结论 PTF = 一 NPT&BF， 

下 面 说 明 怎 样 构造 论 示 A。 对 于 任意 的 论 示 A， 令 工 是 所 有 这 样 的 字符 串 的 集合 : A 

中 有 一 个 长 度 相 同 的 字符 串 。 于 是 
La = {w | 3z E€ ALl z |=| w |]} 
显然 ， 对 于 任何 A, 语言 La 属于 NP4， 

为 了 证 明 LASET PA, wW Fiki A。 设 Mi ,Mz,…， 是 所 有 多 项 式 时 间 论 示 图 灵机 
的 列表 。 为 了 简单 ， 假 定 Mi; 在 时 间 ni 内 运行 。 构 造 过 程 分 步骤 进行 。 第 i 步 构 造 A 的 一 
部 分 ， 保 证 MA 不 判定 La。 通 过 声明 某 些 字符 串 在 A 中 而 另外 一 些 字 符 串 不 在 A 中 来 构 
造 A。 每 一 步 仅 确定 有 穷 个 字符 串 的 状态 〈 指 在 或 者 不 在 A 中 )。 开 始 ， 没 有 关于 A 的 任 
何 信息 。 从 步骤 1 开始 。 

步骤 i CSAL., 已 经 声明 有 穷 个 字符 串 在 或 不 在 A 中 。 选 择 nw， 让 它 比 所 有 这 些 
串 的 长 度 都 长 ， 而 且 n 充分 大 使 得 2* tnt K, ni EM: 的 运行 时 间 。 现 在 说 明 怎 样 扩 展 
关于 A 的 信息 ， 使 得 只 要 RELA, MA 就 接受 它 。 

在 输入 1” 上 运行 Mi， 如 下 回应 它 的 论 示 查询 。 如 果 M: 查询 一 个 状态 已 经 确定 的 字 
符 串 >， 回应 与 它 的 状态 一 致 。 如 果 y 的 状态 还 未 确定 ， 就 对 查询 返回 NO， 并 声明 y 不 
在 A 中。 继续 模拟 Mi; ， 直 到 它 停 机 。 

现在 从 M: 的 角度 考虑 问题 。 如 果 Mi; 发 现 一 个 长 为 n 的 字符 串 在 A 中 ， 它 就 应 该 接 
受 ， 因 为 它 知道 1” 在 La 中 。 如 果 Mi; 确定 所 有 长 为 n 的 字符 串 都 不 在 A 中 ， 它 就 应 该 拒 
绝 ， 因 为 它 知道 1" 不 在 工 A 中 。 但 是 ， 它 没有 足够 的 时 间 来 询问 所 有 长 为 2 的 字符 串 ， 而 
且 我 们 已 经 对 它 所 做 的 每 一 个 查询 都 回答 NO。 所 以 当 M: 停机 时 必须 决定 是 接受 还 是 拒 
绝 ， 而 它 还 没有 足够 的 信息 保证 它 的 决定 是 对 的 。 

现在 的 目标 是 确保 它 的 决定 是 不 对 的 。 为 此 ， 观 察 它 的 决定 ， 然 后 扩展 A 使 其 反面 成 
立 。 于 是 ， 如 果 Mi; 接受 1 ， 就 声明 所 有 剩 下 的 长 为 的 字符 串 都 不 在 A 中 ， 从 而 确定 1” 
不 属于 Ls。 如 果 M; 拒绝 1 ， 就 可 以 找到 一 个 Mi 尚未 查询 过 的 长 为 ”的 字符 串 ， 并 声明 
该 字符 串 属 于 A， 从 而 保证 1 属于 工 4。 这 样 的 字符 串 必 定 存 在 ， 因 为 Mi; 运行 n: 步 ， 少 
FKA n 的 字符 串 总 数 2*。 任 何 情况 都 能 确定 Mi^ 不 判定 La。 

步骤 ;把 那些 状态 还 没有 确定 下 来 且 长 度 不 超过 ?2 的 字符 串 都 声明 为 不 在 A 中 ， 该 步 
完成 。 从 步骤 ;十 1 继续 进行 下 去 。 

已 经 证 明 没 有 多 项 式 时 间 诊 示 图 灵机 能 够 以 褒 示 A 判定 La， 因 此 定理 得 证 。 a 

总 之 ， 相 对 化 方法 表明 : 为 了 解决 P 与 NP 问题 ， 必 须 分 析 计 算 ， 而 不 仅仅 是 模拟 它 
们 。 在 9. 3 节 中 ， 将 介绍 一 种 可 能 会 导 回 这 种 分 析 的 方法 。 


9.3 电路 复杂 性 


将 按照 数字 电路 设计 的 电子 器 件 用 导线 连 在 一 起 ， 就 构成 了 计算 机 。 也 可 以 用 对 应 数 
字 电 路 的 理论 模型 〈 称 为 布尔 电路 ) 来 模拟 如 图 灵机 这 样 的 理论 模型 。 建 立 图 灵机 与 布尔 
电路 之 间 的 联系 有 两 个 目的 。 第 一 ， 研 究 者 相信 电路 提供 了 一 种 方便 的 计算 模型 ， 用 以 处 
理 P 与 NP 问题 及 其 相关 问题 。 第 二 ， 电 路 为 有 关 SAT 是 NP 完全 的 库 克 - 列 文 定 理 提 
供 了 男 一 种 证 明 方 法 。 本 节 讨 论 这 两 个 主题 。 

一 个 布尔 电路 (boolean circuit) 是 由 导线 (wire) 连接 的 门 (gate) 和 
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输入 (input) 的 集合 ， 其 中 不 允许 出 现 循环 。 门 有 三 种 形式 : SN, RN FAN, d 
图 9-2 所 示 。 

布尔 电路 中 导线 传递 布尔 值 0 和 1。 门 是 计算 布尔 函数 AND. OR 和 NOT 的 处 理 器 。 
当 两 个 输入 都 是 1 时 ，AND 函数 输出 1， 否 则 输出 0。 当 两 个 输入 都 是 0 时 ，OR 函数 输 
出 0， 否则 输出 1。NOT 函数 输出 其 输入 的 反面 ， 换 言 之 ， 若 输入 是 0， 它 输出 1， 若 输 
人 是 1， 它 输出 0。 输 入 被 标记 为 z1，… ,zs。 其 中 一 个 门 被 指定 为 输出 门 (output gate), 
图 9- 3 描绘 了 一 个 布尔 电路 。 


输入 
? 
输出 
与 或 非 


图 9-2 “5” Tl. “me” PIA “SE” PJ 图 9-3 布尔 电路 的 例子 


输入 变量 x, x x, 





pi, 


输出 门 


布尔 电路 从 输入 的 赋值 中 计算 输出 值 。 它 沿 着 导线 传播 值 ， 计 算 与 相应 的 门 关 联 的 函 
数 ， 直 到 输出 门 被 赋予 一 个 值 。 图 9- 4 显示 了 布尔 电路 从 输入 的 赋值 中 计算 出 值 的 过 程 。 

用 孔 数 来 描述 布尔 电路 的 输入 /输出 行为 。 给 带 n 个 输入 变量 的 布尔 电路 C 关联 一 个 
PRAM fc:{0,1}" 一 {0,1}， 其 中 ， 当 输入 zx1，… ,zn WEN aissar 时 ， 若 C 的 输出 为 6， 
WA folais san) =b. ROCHA RA fc 。 有 时 考虑 有 多 个 输出 门 的 布尔 电路 。 带 & 个 输 
出 位 的 函数 计算 一 个 值 域 为 {0,1)* 的 函数 。 

n 输入 奇偶 函数 (parity function) parity,:{0,1}"~{0,1} 输出 1， 当 且 
仅 当 输入 变量 中 有 奇数 个 1。 图 9- 5 的 电路 计算 有 4 个 变量 的 奇偶 函数 parity, . a 





1 输出 
图 9-4 布尔 电路 计算 的 例子 图 9-5 计算 4 个 变量 的 奇偶 函数 的 布尔 电路 


实际 上 ， 可 以 用 电路 来 检查 适当 地 编码 为 (0,1》 上 的 语言 的 成 员 资 格 。 存 在 的 问题 
是 ， 任 何 具 体 的 电路 只 能 处 理 某 一 固定 长 度 的 输入 ， 而 语言 可 能 包含 不 同 长 度 的 字符 串 。 
所 以 ， 不 是 用 单一 电路 来 检查 语言 的 成 员 资 格 ， 而 是 用 整个 一 族 电路 来 完成 这 一 任务 ， 每 
个 输入 长 度 有 一 个 电路 。 在 下 面 的 定义 中 形式 化 这 一 概念 。 
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一 个 电路 族 (circuit family) C 是 电路 的 一 个 无 穷 列表 (HA... 
HPC, An ARARE, WCE 10,1) 上 判定 语言 A， 如 果 对 于 每 个 字符 串 wlwEA) 
当 且 仅 当 Ci(w=1, EP nXwwHkeE. 

电路 的 规模 (size) 是 它 所 包含 的 门 的 数目 。 当 两 个 电路 有 同样 的 输入 变量 ， 并 且 在 
每 一 输入 赋值 上 都 输出 同样 值 的 时 候 ， 称 它们 是 等 价 的 。 如 果 一 个 电路 没有 与 之 等 价 的 更 
小 的 电路 ， 则 它 是 (规模 ) 极 小 的 (size minimal) 。 极 小 化 电路 问题 在 工程 上 有 明显 的 应 
用 ， 但 是 一 般 难 以 解决 。 甚 至 判定 一 个 具体 的 电路 是 否 是 极 小 的 这 个 问题 也 不 见得 是 在 了 
或 NP 内 可 解 的 。 一 个 电路 族 中 的 每 一 个 电路 C; 如 果 是 极 小 的 ， 则 称 该 族 是 极 小 的 。 一 
个 电路 族 (Co ,C1i,C:,…) 的 规模 复杂 度 (size complexity) 是 一 个 函数 f:N>N, HH 
fm Æ C 的 规模 。 当 明显 在 讨论 规模 时 ， 用 电路 族 的 复杂 度 指 代 其 规模 复杂 度 。 

电路 的 深度 (depth) 是 从 输入 变量 到 输出 门 的 最 长 路 径 的 长 度 〈 导 线 的 数目 )。 如 同 
定义 电路 的 规模 一 样 ， 可 以 定义 深度 极 小 〈depth minimal) 的 电路 和 电路 族 以 及 电路 族 的 
深度 复杂 度 (depth complexity) 。 在 关于 并 行 计 算 的 10.5 节 中 ， 电 路 的 深度 复杂 度 尤为 
重要 。 

语言 的 电路 复杂 度 (circuit complexity) 是 该 语言 的 极 小 电路 族 的 规模 
复杂 度 。 语 言 的 电路 深度 复杂 度 (circuit depth complexity) 类 似 定 义 ， 只 是 把 规模 换 成 
深度 。 

GEED 容易 推广 例 9. 21， 给 出 计算 ”个 变量 的 奇偶 函数 的 有 Onz) 个 门 的 电路 。 
一 种 办 法 是 构造 一 棵 由 计算 KOR 函数 的 门 组 成 的 二 叉 树 ， 这 里 XOR 函数 就 是 2- 输入 奇 
偶 函 数 (zarityz )， 然 后 如 前 面 的 例子 那样 , 用 2 个 NOT、2 个 AND 和 1 个 OR 实 现 每 
个 XOR 门 。 

令 A 是 包含 奇数 个 1 的 字符 串 组 成 的 语言 ， 那 么 A 的 电路 复杂 度 是 O(n)。 z 

语言 的 电路 复杂 度 与 它 的 时 间 复 杂 度 有 关 。 任 何 时 间 复 杂 度 小 的 语言 其 电路 复杂 度 也 
小 ， 如 下 面 的 定理 所 述 。 

设 t:N>N 是 一 个 函数 ，t(n) 宇 n。 若 ACTIME(t(n)), MA 的 电路 复 
杂 度 为 O(t2(n))。 

该 定理 提供 了 一 条 证 明 P 关 NP 的 途径 ， 以 此 证 明 NP 中 的 某 个 语言 的 电路 复杂 度 超 
过 多 项 式 。 

证 明 思 路 i MEERE tn) 内 判定 A 的 图 灵机 。( 为 了 简单 ， 忽 略 M 的 实际 运行 
时 间 O(z(n)〉 中 的 常数 因子 。， 对 每 一 个 n， 构造 电 路 C, 模拟 M 在 长 为 n 的 输入 上 的 运 
算 。C 的 门 分 成 行 ， 每 一 行 对 应 M 在 长 为 n 的 输入 上 进行 运算 的 :+(n) 步 之 一 。 门 的 每 一 
行 代表 M 在 相应 步骤 上 的 格局 〈 状 态 、 读 写 头 位 置 、 带 子 内 容 )。 每 一 行 用 导线 连 到 上 一 
行 ， 以 使 它 从 上 一 行 的 格局 能 够 计算 本 格局 。 修 改 M 使 得 输入 编码 为 {0,1}. Bb, 4 
M 即将 接受 时 ， 它 把 读 写 头 移 到 最 左 单元 ， 在 进入 接受 状态 之 前 先 在 那里 写 下 符号 U。 这 
样 一 来 ， 就 可 以 指定 电路 的 最 后 一 行 的 一 个 门 为 输出 门 。 

证 明 设 M=(Q,3, 厂 ,6,qo accept Greje) 在 时 间 t(n) 内 判定 A， RwkKAn 的 输 
A. 定义 M 在 w 上 的 画面 为 一 张 :(n) Xt) 的 表格 ， 其 行 是 M 的 格局 。 画 面 的 顶 行 包 
含 M 在 w 上 的 起 始 格 局 。 第 i 行 包 含 计 算 历 史 的 第 i 步 的 格局 。 

为 了 方便 ， 本 证 明 修 改 了 格局 的 表示 形式 。 在 3. 1. 1 节 描 述 的 旧 的 形式 中 ， 状 态 出 现 
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在 读 写 头 正 在 读 取 的 符号 的 左边 。 与 之 不 同 ， 现 在 把 状态 和 读 写 头 下 的 符号 表示 为 一 个 单 
一 的 复合 字符 。 例 如 ， 若 M 在 状态 ， 带 子 上 包含 字符 串 1011， 读 写 头 正 读 取 左 起 第 二 个 
符号 ， 旧 形式 为 14011， 新 形式 为 1 |a0| 11， 其 中 复合 字符 [g0| 同时 表示 状态 q 和 读 写 头 下 
的 符号 0。 

画面 的 每 一 格 可 以 包含 一 个 带子 符号 (TT 的 成 员 ) 或 状态 和 带子 符号 的 组 合 (QXT 
的 成 员 )。 称 画面 的 第 i1 行 、 第 j 列 的 那 一 格 为 ce2Li, yj。 画面 的 顶 行 是 cell[1,1],…， 
cell[1,t(n)]， 该 行 包含 起 始 格 局 。 

在 定义 画面 的 概念 中 ， 关 于 M 做 了 两 个 假设 。 第 一 ， 正 如 证 明 思 路 中 所 讲 的 ， 仅 当 
读 写 头 在 最 左 带子 单元 上 并 且 该 单元 包含 符号 LU 时 ，M 才 接 受 。 第 二 ， 一 旦 M 停机 ， 它 就 
永远 待 在 同一 格局 中 。 所 以 ， 通 过 查看 画面 最 末 一 行 的 最 左 单元 cell[1(n) ,1]， 就 能 确定 
M 是 否 已 经 接受 。 图 9- 6 显示 了 M 在 输入 0010 上 的 部 分 画面 。 


cema -904014140 o [u| 起 始 格 局 
dd | eee 


cell[t(n),1] 


(接受 位 置 ) l 
图 9-6 M 在 输入 0010 上 的 画面 


每 一 单元 的 内 容 都 由 上 一 行 的 某 些 单元 来 决定 。 如 果 知 道 了 cell[i 一 1 ,j 一 1]、 
celllLi—1,j ]McellLi—1,j+1] 的 值 ， 就 能 根据 M WIPE RRAK S cell isj] 的 值 。 例 如 ， 
下 图 放大 了 图 9-6 的 画面 的 一 部 分 。 上 一 行 的 三 个 符号 0、0 和 1 是 不 含 状态 的 带子 符号 ， 
所 以 中 间 符 号 在 下 一 行 必须 保持 为 0， 如 下 图 所 示 。 





第 t(n) 个 格局 





现在 开始 构造 电路 Cs。 对 应 画面 的 每 一 个 单元 有 多 个 门 ， 这 些 门 从 影响 某 一 单元 的 
另外 三 个 单元 的 值 中 计算 出 该 单元 的 值 。 

为 了 使 构造 更 容易 描述 ， 添 加 一 些 灯 来 表示 电路 中 某 些 门 的 输出 。 灯 只 是 用 作 说 明 ， 
不 影响 电路 的 操作 。 

设 k 是 TU (TXQ) 中 元 素 的 数目 。 对 于 画面 的 每 一 个 单元 有 & ANT, 本 的 每 个 成 员 
HMRI, TXA 的 每 个 成 员 对 应 一 慢 灯 ， 总 共 Re? (Cn) BEAT. PRIX LENT light(i,j,5], 
其 中 1<&i,j 志 (i(n),sETU (TXQ)。 在 一 个 单元 中 的 灯 的 状况 表明 了 该 单元 的 内 容 ; 如 果 
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lightli,j,s] FÆ, cell ij] WEERTS s。 当 然 ， 如 果 电 路 构造 正确 ， 一 个 单元 中 只 能 
ARIAS. 

AGB RAAB. (URE cellli,j|] 中 的 0gAtLi js]。 如 果 该 单元 包含 符号 s, 
Xe MARA. SRB cellli,gj] 的 三 个 单元 ， 确 定 哪 些 赋值 会 使 cellLi,jj」 包 含 ;。 
通过 考察 转移 荫 数 6， 就 可 以 做 此 决定 。 

假定 ， 按照 Ò, 当 单 元 5 lll imli] cell ¢—1Is3 FL] 分 别 包含 as 
b,c 时 ，cellLi,7j」 包含 s。 用 导线 连接 电路 ， 使 得 如 果 lightLi-—1,j—1,a], lightli—1,j, 
b] 和 lightLi—1,j+l.c] MAA, Wlightli,j,s|] 也 开 着 。 为 此 把 i 一 1 行 的 这 三 蕉 灯 连 
到 与 门 ， 其 输出 连 到 lightli,j,s]. 

—fRIHKG, cellli—1,j—1], cellLi—1,j], cellLi—1,j+1] 有 几 个 不 同 的 赋值 (a, 
bi c1), Caz ,bz2 yc2)，…， (ay pc) 都 可 以 使 cellli.j] 包含 s。 在 这 种 情况 下 ， 用 导线 连接 
电路 ， 使 得 对 应 每 一 组 赋值 a; ,bi ,c;， 各 自 的 灯 都 连 到 与 门 ， 所 有 与 门 都 连 到 或 门 。 这 个 
电路 如 图 9-7 所 示 。 

刚才 描述 的 电路 对 每 功 灯 都 一 样 ， 只 是 
在 边界 上 有 几 处 例外 。 画 面 的 左边 界 上 的 每 
个 单元 ; BI cellLi,1], 1\Sixt(n), RAE 
一 行 的 两 个 单元 可 能 影响 它 的 内 容 。 在 右边 
界 上 的 单元 也 是 一 样 。 在 这 种 情况 下 ， 修 改 
电路 ， 让 它 模拟 M 在 这 种 情况 下 的 行为 。 

第 一 行 的 单元 都 没有 前 驱 ， 需 要 用 一 种 
特殊 方式 处 理 它 们 。 这 些 单 元 包含 起 始 格 
局 ， 它 们 的 灯 用 导线 连 到 输入 变量 。 于 是 
light[1,1,|qo1|] 连 到 输入 zw ， 因 为 起 始 格 
局 以 起 始 状态 符 q 开始 ， 读 写 头 在 w 上 起 
动 。 类 似 地 ， light[1,1,|go0|] 通过 非 门 连 到 输入 zw 。 进 一 步 ， lightL1,2,1],+++,lightL1,n, 
1] 连 到 输入 wz ,… ,vwn ,而 dightl1,2,0],°-,lightL1,n,0] 通过 非 门 连 到 输入 woos, wns 
因为 输入 字符 串 w 决定 了 这 些 值 。 另外 ， light[1,nt1,U], ,light[L1,t(n),U] 都 开 着 ， 
因为 第 一 行 中 剩余 的 单元 对 应 带子 上 初始 为 空格 (U) 的 位 置 。 最 后 ， 第 一 行 中 所 有 其 他 
KT ABR 

到 此 为 止 ， 已 经 构造 了 一 个 电路 来 模拟 M 的 第 1:(n) 步 。 剩 下 要 做 的 就 是 指定 一 个 门 
为 电路 的 输出 门 。 当 M 在 第 t+(n) 步 在 带子 左 端 的 一 个 包含 U 的 单元 上 进入 接受 状态 Qaccept 
时 ， 它 接受 ww。 所 以 指定 输出 门 为 与 light[t(n) 51, |dan] 相关 联 的 门 。 这 就 完成 了 本 
定理 的 证 明 。 g 

除了 把 电路 复杂 性 与 时 间 复 杂 性 联系 起 来 以 外 ， 和 定理 9. 25 还 给 出 了 定理 7.22( 即 库 
w- IXE) 的 另 一 种 证 明 ， 如 下 所 述 。 称 布尔 电路 是 可 满足 的 ， 如 果 输 入 的 某 一 赋值 
使 电路 输出 1。 电 路 可 满足 性 (circuit-satisfiability〉 问 题 就 是 判定 一 个 电路 是 否 是 可 满足 


的 。 令 





图 9-7 — ZIT W h 


CIRCUIT-SAT = {(C) |C 是 可 满足 的 布尔 电路 } 
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前 面 的 定理 9. 25 说 明 布 尔 电 路 能 够 模拟 图 灵机 。 用 这 个 结果 来 证 明 CIRCUIT- SAT 是 
NP 完全 的 。 

CIRCUIT-SAT 是 NP 完全 的 。 

WEAR 为 了 证 明 该 定理 ， 必 须 证 明 CIRCUIT-SAT 属于 NP， 并 且 NP 中 的 任何 语言 
A 都 可 归 约 到 CIRCUIT-SAT。 第 一 点 是 显然 的 。 为 了 证 明 第 二 点 ， 必 须 给 出 多 项 式 时 间 
IAA /7， 把 字符 串 映射 为 电路 ， 其 中 

flw) = <C) 
w EA SHREK OC 是 可 满足 的 

因为 A 属于 NP， 所 以 它 有 多 项 式 时 间 验 证 机 器 V， 其 输入 的 形式 为 (zx,c),， 这 里 c 
可 以 是 证 明 z 属于 A 的 证 书 。 为 了 构造 f， 用 定理 9. 25 的 方法 得 到 模拟 V HN. fw 
的 符号 填 人 对 应 于 z 的 电路 的 输入 。 剩 下 的 电路 输入 都 对 应 证 书 c<。 把 这 个 电路 称 为 C, 

若 C 是 可 满足 的 ， 则 存在 一 个 证 书 ， 所 以 也 属 于 A。 反 之 ， 若 也 属于 A， 则 存在 一 
个 证 书 。 所 以 C 是 可 满足 的 。 

为 了 证 明 该 归 约 在 多 项 式 时 间 内 运算 ， 必须 考察 定理 9. 25 的 证 明 ， 注 意 到 电路 的 
构造 可 以 在 nn 的 多 项 式 时 间 内 完成 。 验 证 机 的 运行 时 间 是 夫 ， 所 以 构造 的 电路 的 规模 是 
O(n*)。 电 路 的 结构 非常 简单 (实际 上 它 的 重复 度 很 高 );， 所 以 归 约 的 运行 时 间 是 
Oln’. s 

现在 证 明 3SAT 是 NP 完全 的 ， 从 而 完成 库 克 - 列 文 定 理 的 另 一 种 证 明 方 法 。 

3SAT # NP 完全 的 。 

证 明 思 路 3SAT 在 NP 中 是 显然 的 。 下 边 证 明 所 有 NP 中 的 语言 都 在 多 项 式 时 间 内 
归 约 到 3SAT。 为 此 把 CIRCUIT-SAT 在 多 项 式 时 间 内 归 约 到 3SAT。 归 约 把 电路 C 转化 
为 公式 g. HF C 可 满足 当 且 仅 当 8 可 满足 。 公 式 为 电路 中 的 每 个 变量 和 每 个 门 都 保留 一 
个 变量 。 

在 概念 上 ， 公 式 模 拟 了 电路 。y 的 满足 赋值 包含 C 的 满足 赋值 ， 它 也 包含 C 在 满足 
赋值 上 的 计算 历史 中 每 一 个 门 的 值 。 实 际 上 ，y 的 满足 赋值 猜测 C 在 满足 赋值 上 的 所 有 
计算 ， 并 且 最 后 p 的 子 句 检查 计算 的 正确 性 。 另 外 ，#$ 包含 一 个 子 句 来 规定 C 的 输出 
1, 

证 明 给 出 一 个 从 CIRCUIT-SAT 到 3SAT 的 多 项 式 时 间 归 约 f。 设 C 是 一 个 电路 ， 
包含 输入 Zz1,… ,Zz 和 门 g1，…,gm。 归 约 从 C 构造 包含 变量 X11,… zi 819° ,gm 的 公式 y。 
$ 的 每 一 个 变量 对 应 C 的 一 条 导线 。 变 量 x; 对 应 输入 导线 ， 变 量 g; 对 应 门 输出 的 导线 。 
把 y 的 变量 标记 为 w o> Wmo 

现在 描述 $ 的 子 句 。 首 先 使 用 蕴涵 直观 地 描述 $ 的 子 句 ， 再 将 蕴涵 (PP 一 Q) 转换 成 
(PV Q)。C 中 每 一 个 带 输 入 导线 w; 和 输出 导线 wj 的 非 门 等 价 于 表达 式 

(D0 == w) A y > Wj) 
该 表达 式 转 换 成 两 个 子 句 
(wi V w) A (wi V w) 
注意 ， 当 且 仅 当 w 和 w; 的 赋值 正确 地 反映 非 门 的 功能 时 ， 这 两 个 子 句 才 同时 被 满足 。 
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C 中 每 一 个 带 输 入 w; Mw; 以 及 输出 wi 的 与 门 等 价 于 表达 式 
(Cw; A wi) > we) A (wi A w) > wed A (wi A w) > wr) 人 (人 (Ci A w) > we) 
转换 成 四 个 子 句 为 

(wi V wi V we) A (wi V w V wed) A œ V w V w) A (WiV w V w) 
C 中 每 一 个 带 输入 w Aw; 以 及 输出 w 的 或 门 等 价 于 表达 式 
(Cw: A w) > we) A (wi A wi) > we) A Cw: A Ww) > wed 人 (人 (ui A w) > we) 
转换 成 四 个 子 句 为 

(wi V wi V we) A Cwi V wi V wed) A Coe V w V we) A Cai V wy V we) 

在 这 两 种 情况 下 ， 只 有 当 变 量 w;、w; 和 w 的 赋值 正确 地 反映 了 门 的 功能 时 ， 所 有 
四 个 子 句 才能 被 满足 。 男 外 ， 把 子 句 (wm) MASP, wr EC 的 输出 门 。 

所 描述 的 某 些 子 句 包含 的 文字 少 于 三 个 。 通 过 重复 文字 就 可 以 把 这 些 子 句 扩 展 到 所 需 
要 的 长 度 。 例 如 ， 将 子 句 Cwm) 扩展 为 等 价 的 子 名 《wm V wm V wm). KRM SWE. 

下 边 简 要 地 说 明了 该 构造 满足 要 求 。 如 果 存 在 满足 C 的 赋值 ， 那 么 根据 C 在 该 赋值 上 
的 计算 历史 来 给 变量 g; 赋值 ， 就 可 以 得 到 满足 $ 的 赋值 。 反 之 ， 如 果 存 在 满足 $ 的 赋值 ， 
它 就 给 出 了 C 的 赋值 ， 因 为 它 描 述 了 C 的 整个 计算 历史 ， 其 中 输出 值 是 1。 归 约 可 以 在 多 项 
式 时 间 内 完成 ， 因 为 计算 历史 简单 ， 输 出 规模 是 输入 规模 的 多 项 式 (实际 上 是 线性 的 )。 m 
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A9.1 证 明 TIME(2") = TIME(2"+!), 
A9,2 证 明 TIME(2")¢ TIME(22"), 
Ag9.3 证 明 NTIME(n)G PSPACE。 
9.4 如 在 图 9-4 中 所 做 的 那样 ， 标 出 图 9- 5 所 描绘 的 电路 中 所 有 门 计算 出 的 值 ， 从 而 说 明 它 在 输 
入 0110 上 的 计算 历史 。 
95 给 出 三 个 输入 变量 上 计算 奇偶 函数 的 电路 ， 并 说 明 它 在 输入 011 上 的 计算 历史 。 
9.6 证 明 若 AEP， 则 PA=P, 
9.7 给 出 带 指数 的 正则 表达 式 ， 产 生 如 下 在 字母 表 (0,1) 上 的 语言 : 
Aa. 所 有 长 度 为 500 的 字符 串 。 
Ab. 所 有 长 度 不 超过 500 的 字符 串 。 
Ac. 所 有 长 度 不 少 于 500 的 字符 串 。 
Ad. 所 有 长 度 不 等 于 500 WFR. 
e 所 有 恰好 包含 500 个 1 的 字符 串 。 
f. 所 有 包含 至 少 500 个 1L 的 字符 串 。 
g. 所 有 包含 至 多 500 个 1 的 字符 串 。 
h. 所 有 长 度 不 少 于 500 并 且 在 第 500 个 位 置 上 为 一 个 0 的 字符 串 。 
i. 所 合 包 含 两 个 0 并 且 其 间 至 少 相 隔 500 个 符号 的 字符 串 。 
9.8 GREEWRARK, FR" 代表 表达 式 
R” U R™+1 U see U R” 
说 明 怎 样 利用 通常 的 指数 算 子 实现 算 子 Riw…” , ARWAH “ee” 
9.9 ”证明 车 NP=P™T, ， 则 NP=coNP, 
9.10 在 问题 8. 29 中 已 经 证 明 ，ArpA 是 PSPACE 完全 的 ， 
a. ULAR Aera 是否 属 于 NL 并 给 出 解释 。 
b. 说 明 ALpsA 是 否 属于 了 并 给 出 解释 。 
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9.11 在 问题 7. 19 中 给 出 了 语言 MAX-CLIQUE, 证明 MAX-CLIQUE€ P™’ , 
问题 
9.12 回忆 一 下 ， 指 定 多 个 输出 门 ， 就 可 以 考虑 输出 {0,1} 上 的 字符 串 的 电路 了 。 设 add,:{0,1}"—> 
{0,1}"+1 计 算 两 个 久 位 二 进 制 整 数 的 和 并 输出 nn 十 1 位 结果 。 证 明 可 以 用 Om) 规模 的 电路 计 
F pM add, « 
9.13 定义 函数 majority, :{0,1}">{0,1}) X: 
Ta QO Da<n/2 
majorit yn (X1 9*** » Xn) = L Reset 
于 是 majority, 图 数 返回 输入 中 的 多 数 派 。 证 明 majority, 可 以 用 下 面 的 电路 计算 : 
a. O(n?) 规模 的 电路 。 
b. O(nlogn) 规模 的 电路 。( 提 示 : 递归 地 把 输入 数 分 成 两 半 并 利用 问题 9. 12 的 结果 。) 
* 9.14 如 问题 9. 13 一 样 定义 问题 majority, 。 证 明 它 可 以 用 Om) 规模 的 电路 计算 。 
9.15 假设 A 和 忆 是 两 个 论 示 。 现 只 知道 其 中 一 个 是 TQBF 的 论 示 ， 但 不 知道 到 底 是 哪 一 个 。 请 给 
出 一 个 能 访问 A 和 B 的 算法 ， 并 且 该 算法 能 在 多 项 式 时 间 内 解决 TQBF 问题 。 
9.16 证 明 存在 论 示 C 使 得 NPC 关 coNP°。 
9.17 ”kk- 查 询 论 示 图 灵机 (k-query oracle Turing machin) 是 在 每 个 输入 上 人 允许 至 多 进行 次 查询 的 
论 示 图 灵机 。 用 符号 MRR A 的 &- AMAA RLM, eM PA4'* 为 能 在 多 项 式 时 间 
内 被 M4 判定 的 语言 集合 。 
a. 证 明 NPU coNPCPS47,1，, 
b. 假设 NPÆcoNP, 证 明 PUcoNPG PAT, 
9.18 定义 唯一 满足 Cunique-sat) 问题 为 : USAT= 二 {(8)14$ 是 一 个 只 有 唯一 满足 赋值 的 布尔 公式 }。 
证 明 USAT € PST， 
9.19 $ EREx+ 二 {《R)|R 是 一 个 具有 指数 形式 的 正则 表达 式 ，L(R) 二 名 }， 证 明 Erx EP. 
9.20 说 明 下 面 的 关于 P 关 NP 的 错误 “证 明 ” 错 在 哪里 。 采 用 反 证 法 。 假 设 P==NP,， W SATEP. 
所 以 ， 对 于 某 个 &，SATETIME(x) 。 因 为 NP 中 的 每 个 语言 多 项 式 时 间 可 归 约 到 SAT， 所 
以 NPCTIME(C(m)。 因 此 POTIME(n'). 但 是 ， 由 时 间 层 次 定理 ，TIME(n*T!1) 包含 不 在 
TIME”) 中 的 语言 ， 这 与 PETIME() 了 矛盾。 所 以 PANP. 
9.21 考虑 函数 pad:>* XN>>* #* 定义 如 下 : $ pad(s, )=s#i, HP j=max(0,l—m), ms 
的 长 度 。 于 是 pad(s,l) REE s 的 末尾 添加 足够 多 的 新 符号 # ， 使 得 结果 的 长 度 至 少 是 /2。 对 
于 任何 语言 A 和 函数 f:N>N, CMBR pad(A,f) X: 
pad (A, f) = {pad(s;f(m))|sE Ames 的 长 度 } 
WH: 着 AETIME(n),， 则 pad(A,n?)€ETIME(n)，。 
9.22 证 明 : # NEXPTIME4EXPTIME, Jl] P 关 NP。 你 会 发 现 问题 9. 21 中 定义 的 函数 pad 对 证 明 
本 问题 是 有 用 的 。 
A9.23 如 问题 9. 21 一 样 定义 pad. 
a. WEH: 对 任何 语言 A 和 任何 自然 数 k，AEP 4AM pad(A,n)EP. 
b. 证 明 P 关 SPACE(n)。 
9.24 证 明 TQBFG SPACE(n!'/3)。 
“9.25 参考 问题 5. 14 中 关于 2DFA ( 双 头 有 限 自 动机 ) 的 定义 ,证 明 在 P 中 存在 一 个 语言 不 能 被 
2DFA 识别 。 
习题 选 解 
91 大 O 记 法 定义 了 时 间 复 杂 性 类 ， 因 此 常量 因子 对 分 类 没有 影响 。 函 数 2*1! 的 时 间 复 杂 性 是 
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9.3 


9.7 


PERD AZRE 


OC2*)， 所 以 AE TIME(2") 当 且 仅 当 AC TIME(2"*!), 

由 于 2"<2?", fe TIME(2")CTIME(22") 成 立 。 利 用 时 间 层 次 理论 ， 可 以 证 明 这 个 包含 关系 

是 真 包 含 的 。 函 数 22 是 时 间 可 构造 的 ， 因 为 在 O(2*”) 时 间 内 ， 一 个 图 灵机 可 以 先 写 一 个 1 

然后 紧 跟 2n 个 0。 因 此 时 间 层 次 理论 确保 存在 这 样 一 个 语言 A， 它 可 以 在 O(2*”) 内 判定 ， 但 

不 能 在 0( 2?" /log2?")=0(2?"/2n) 内 判定 。 所 以 AETIME(22*), 但 Ag TIME(2"), 

因为 任何 图 灵机 在 某 个 计算 分 支 上 运行 耗费 时 间 tC) 时 ， 它 在 该 分 支 上 使 用 的 单元 格 至 多 为 

t(n) 个 ， 所 以 NTIME(n)CNSPACE(n). #8 HE BY 4 Af ee HA A] NSPACE(z)SSPACE(2 )。 根 

据 空 间 层 次 定理 SPACE (rn?)G SPACE(mw)。 由 于 SPACE) PSPACE, 所 以 NTIME(n)& 

PSPACE, 

a. z0% b. Coley 了 d Ue Us x" 

a CA 是 任何 语言 RON, ACP, Il pad(A,mn*)EP， 这 是 因为 通过 以 下 几 个 步骤 可 以 得 
出 这 个 结论 。 第 一 步 ， 通 过 将 w 写成 s#/ 的 形式 (其 中 :不 包含 符号 #) 从 而 判断 wE 
pad(A nm eB RI. HO, Hil wl = lsi 是 否 成 立 。 第 三 步 ， 判断 ;SE A 是 否 成 立 。 
在 多 项 式 时 间 内 完成 第 一 步 是 显然 的 。 第 二 步 的 运行 时 间 为 |s| 的 多 项 式 ， 因 为 |s| 三 |w|， 
运行 时 间 为 |w| 的 多 项 式 ， 所 以 第 二 步 在 多 项 式 时 间 内 完成 。 若 pad(A,nt)EP, W AEP, 
因为 通过 用 # 对 w 进行 填充 直到 其 长 度 为 | wl*， 这 样 可 判断 wEA 是 否 成 立 ， 接 着 判断 它 
是 否 属于 pad(A,n*)。 两 个 步骤 都 仅 需 要 多 项 式 时 间 。 

b. 假设 P= 二 SPACE(n)。 令 A 是 一 个 语言 ， 它 属于 SPACE), 但 不 属于 SPACE(n)。 根 据 
空间 层次 定理 ，A 是 存在 的 。 因 为 在 填充 语言 里 消耗 的 空间 是 线性 的 ， 存 在 足够 的 空间 运 
行 AM O(n’) 空间 算法 ， 所 以 pad(A,n?)€ SPACE(n), 根据 假设 ，pad(A,n:)EP， 因 此 
根据 (a)〉 中 的 证 明 ，AEP， 从 而 AE SPACE(n)。 推 出 了 矛盾 。 
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复杂 性 理论 高 级 专题 





本 章 简 要 地 介绍 复杂 性 理论 中 的 几 个 其 他 专题 。 这 是 一 个 非常 活跃 的 研究 领域 ,， 包 
含 着 丰富 的 研究 内 容 。 本 章 涉 及 很 多 更 为 高 级 的 专题 内 容 ， 但 不 是 对 所 有 问题 进行 全 面 
综述 。 需 要 特别 指出 的 是 ， 其 中 有 两 个 重要 的 专题 超出 了 本 书 的 范围 ， 它 们 分 别 是 : 量 
子 计 算 (quantum computation) 和 概率 可 核查 证 明 (probabilistically checkable proof)。 
«The Handbook of Theoretical Computer Science) [74] 提供 了 关于 计算 理论 早期 工作 的 

本 章 的 主要 内 容 包 括 近 似 算 法 、 概 率 算法 、 交 互 式 证 明 系 统 、 并 行 计算 以 及 密码 学 
等 。 除 了 交互 式 证 明 系 统 和 和 密码 学 两 节 中 用 到 概率 算法 之 外 ， 其 他 各 节 都 是 相互 独立 的 。 
10. 1 近似 算法 

在 有 的 问题 如 最 优化 问题 (optimization problem) 中 ， 我 们 试图 在 所 有 的 可 行 解 中 找 
到 最 好 的 解 。 例 如 ， 寻 找 图 中 的 最 大 团 ， 最 小 顶点 覆盖 ， 或 者 两 个 顶点 之 间 的 最 短路 径 
等 。 前 两 个 问题 是 NP 难 解 问题 。 当 最 优化 问题 是 NP 难 解 问题 的 时 候 ， 不 存在 找到 最 好 
解 的 多 项 式 时 间 算 法 ， 除 非 P=NP. 

在 实践 中 ， 找 到 绝对 最 好 的 解 通常 较为 困难 ， 而 且 可 能 用 户 并 非 一 定 要 找到 某 个 问题 
的 绝对 最 好 的 解 ， 即 最 优 解 。 一 个 接近 最 优 的 解 可 能 已 经 足够 好 ， 而 且 可 能 更 容易 找到 。 
顾名思义 ， 近 似 算 法 (approximation algorithm) 是 为 寻求 这 种 近似 最 优 解 而 设计 的 。 

例如 ， 考 虑 7. 5 节 所 讨论 的 顶点 覆盖 问题 。 顶 点 覆盖 问题 被 描述 为 一 个 表示 判定 问题 
(decision problem) 的 语言 YERTEX-COVER 。 判 定 问题 只 有 两 个 答案 一 一 是 或 非 。 该 问 
题 的 最 优化 形式 记 作 MIN VERTEX-COVER 。 任意 给 定 一 个 图 ， 其 目标 是 在 所 有 可 能 的 
顶点 覆盖 中 找到 一 个 最 小 的 顶点 覆盖 。 下 述 多 项 式 时 间 算 法 近似 地 解 这 个 最 优化 问题 。 它 
给 出 一 个 顶点 覆盖 ， 其 规模 不 超过 最 小 顶点 覆盖 的 2 售 。 

A 二 “对 于 输入 (G);， 这 里 G 是 一 个 无 向 图 : 

1. 重复 下 述 操作 直至 G 中 所 有 的 边 都 与 有 标记 的 边 相 邻 。 
2. 在 G 中 找 一 条 不 与 任何 有 标记 的 边 相 邻 的 边 。 

3. 给 这 条 边 作 标记 。 

4. 输出 所 有 有 标记 的 边 的 顶点 。?” 

上 述 算法 A 是 一 个 多 项 式 时 间 算 法 ， 它 给 出 G 的 一 个 项 点 履 盖 ， 其 规 
模 不 超过 G 的 最 小 顶点 覆盖 的 24. 

证 明 A 的 运行 时 间 显 然 是 多 项 式 界 限 的 。 设 X 是 它 输 出 的 顶点 集合 ， 互 是 有 标记 
的 边 的 集合 ， 因 为 G 的 每 一 条 边 要 么 属于 瓦 ， 要 么 与 五 中 的 一 条 边 相 邻 ， 所 以 X 与 G 中 
所 有 的 边关 联 。 因 此 ，X 是 一 个 顶点 有 覆盖。 

为 了 证 明 X 的 规模 不 超过 最 小 顶点 覆盖 Y 的 2 倍 ， 我们 要 确认 两 个 事实 : X 中 顶点 
的 数目 大 小 是 五 的 2 倍 和 互 不 大 于 Y。 首 先 ， 互 中 的 每 一 条 边 为 X 提供 2 个 顶点 ， 从 而 
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X 中 顶点 的 数目 大 小 是 互 的 2 倍 。 其 次 ,，Y 是 一 个 顶点 覆盖 ， 从 而 H 中 的 每 一 条 边 与 Y 
PHS KK. AFA 中 的 边 互 不 相 邻 ， 故 Y 中 的 顶点 不 可 能 同时 关联 五 中 的 两 条 
边 。 由 于 立 中 有 不 同 的 顶点 关联 互 中 的 每 一 条 边 ， 所 以 顶点 覆盖 Y ADF. A, X 
中 顶点 的 数目 大 小 不 超过 YY 的 2 售 。 » 

MIN- VERTEX-COVER 是 一 个 最 小 化 问题 (minimization problem) ， 因 为 我 们 的 目 
标 是 求 可 行 解 中 最 小 的 解 。 在 最 大 化 问题 (maximization problem) 中 ， 我 们 试图 求 最 大 
的 解 。 如 果 一 个 最 小 化 问题 的 近似 算法 总 能 找到 不 超过 最 优 解 上 倍 的 可 行 解 ， 则 称 这 个 算 
法 是 k- 优 的 〈k-optimal)。 前 面 关 于 顶点 覆盖 问题 的 算法 是 2- 优 的 。 对 于 最 大 化 问题 ， 一 


个 太 优 近似 算法 总 能 找到 不 小 于 最 优 解 大 小 的 二 的 可 行 解 。 


下 面 是 最 大 化 问题 MAX-CUT 的 近似 算法 。 把 顶点 集 V 划分 成 两 个 互 不 相交 的 子 集 
S 和 耳 ， 称 为 无 向 图 中 的 割 (cut)。 一 个 顶点 在 S 中 ， 另 一 个 顶点 在 工 中 的 边 对 称 作 割 边 
(cut edge)。 如 果 一 条 边 不 是 割 边 ， 则 称 作 非 割 边 Cuncut edge) 。 割 边 的 数目 称 作 割 的 大 
小 。MAX-CUT 求 输入 图 G 中 的 最 大 割 。 正 如 在 问题 7. 54 中 所 说 明 的 ， 该 问题 是 NP 完 
全 问题 。 下 述 算法 因子 2 的 范围 内 在 近似 MAX-CUT. 

B= 二 “对 于 输入 (G);， 这 里 G 是 顶点 集 为 V 的 无 向 图 : 

a 

2. 如 果 把 一 个 顶点 从 S BET MAT BBS, 使 制 的 大 小 变 大 ， 则 做 这 样 的 移 
动 ， 并 且 重 复 这 一 步 。 

3. 如 果 不 存 在 这 样 的 顶点 ， 则 输出 当前 的 割 并 且 停 止 。” 

该 算法 从 一 个 (假定 是 ) 坏 的 割 开 始 ， 然 后 做 局 部 改进 ， 直 到 不 能 进一步 做 局 部 改进 
为 止 。 虽 然 这 个 过 程 一 般 不 能 给 出 最 大 的 割 ， 但 是 可 以 证 明 ， 它 给 出 的 割 的 大 小 至 少 是 最 
大 割 大 小 的 一 半 。 

Cae) 上 述 算法 也是 MAX-CUT 的 2- 优 的 多 项 式 时 间 近 似 算 法 。 

证 明 由 于 每 次 执行 步骤 2 增加 割 的 大 小 ， 而 割 的 大 小 不 超过 G 的 边 数 ， 故 B 在 多 项 
式 时 间 内 运行 。 

现在 证 明 B 输出 的 割 不 小 于 最 大 割 的 一 半 。 实 际 上 ， 要 证 明 更 强 的 结论 : B 输出 的 割 
至 少 包含 G 中 所 有 边 的 一 半 。 观 察 到 ， 在 G 的 每 一 个 顶点 ， 割 边 不 少 于 非 割 边 ， 否 则 B 
要 把 该 顶点 移 到 另 一 边 。 把 所 有 顶点 的 割 边 数 加 在 一 起 ， 这 个 和 是 割 边 总 数 的 2 倍 ， 因 为 
每 一 条 割 边 对 它 的 两 个 端点 各 计算 一 次 。 根 据 前 面 的 观察 ， 这 个 和 不 小 于 所 有 顶点 非 割 边 
数 之 和 。 于 是 ，G 中 的 割 边 不 少 于 非 割 边 ， 从 而 B 输出 的 割 中 至 少 包 含 所 有 边 的 一 半 。 于 


10.2 概率 算法 


概率 算法 以 随机 过 程 为 工具 。 典 型 算法 包含 一 条 “ 掷 硬 币 ” 的 指令 ， 并 且 掷 硬币 的 绪 
果 可 能 影响 算法 后 面 的 执行 和 输出 。 对 某 些 类 型 的 问题 ， 相 对 于 确定 型 算法 ， 用 概率 算法 
更 容易 解决 。 

对 于 一 个 具体 的 计算 任务 ， 用 掷 硬币 做 出 决定 怎么 能 比 通过 实际 计算 或 者 估计 而 得 到 
的 最 好 的 选择 更 好 呢 ? 有 时 ， 计 算 最 好 的 选择 可 能 需要 过 多 的 时 间 ， 而 估计 则 可 能 带 有 偶 
好 ， 使 得 出 的 结论 无 效 。 例 如 ， 统 计 学 家 用 随机 抽样 确定 有 关 一 个 大 的 群体 中 所 有 人 的 信 
息 ， 如 他 们 的 爱好 或 政治 倾向 。 调 查 所 有 的 人 可 能 需要 太 长 的 时 间 ， 调 查 一 部 分 随机 挑选 
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出 来 的 人 则 可 能 得 出 错误 的 结论 。 


10.2.1 BPP % 


为 了 更 为 形式 化 地 讨论 概率 计算 问题 ， 这 里 首先 定义 一 个 新 的 计算 模型 
机 ， 然 后 介绍 一 个 与 高 效 的 概率 计算 相关 的 复杂 性 类 并 给 出 几 个 例子 。 

概率 图 灵机 (probabilistic Turing Machine) M 是 一 种 非 确 定型 图 灵机 ， 
它 的 每 一 非 确 定性 步 称 作 丘 硬币 步 (coin-flip step)， 并 且 有 两 个 合法 的 下 步 动 作 。 按 照 下 
述 方 式 把 概率 赋 给 M 对 输入 w 的 每 一 个 计算 分 支 6。 定 义 分支 6 的 概率 为 

Prip = 2 
其 中 , RRADP LD FERHAN HR, 定义 M 接受 ww 的 概率 为 
P[M#Zw]= >, Pr[6] 
b 是 接受 分 支 

换言之 ， 如 果 模 拟 M 对 w 的 计算 ， 在 每 一 掷 便 币 步 ， 用 掷 重 币 决定 下 一 步 的 动作 ， 

则 M 接受 w 的 概率 等 于 它 到 达 接 受 格 局 的 概率 。 令 
PrLM #24 w]l=1—Pr[M#%w] 

通常 ， 当 概率 图 灵机 接受 属于 某 一 语言 的 所 有 字符 串 并 且 拒 绝 不 在 这 个 语言 中 的 所 有 

字符 串 时 ， 称 概率 图 灵机 判定 该 语言 。 但 是 如 果 人 允许 机 器 有 小 的 错误 概率 ， 如 对 于 某 个 正 


Be(0<e<>), mR 


1. wE A AWM Pr[ M 接受 w ] 辫 1 一 es， 并 且 

2. wEA Bai PrLM 拒绝 ww |>1—e, 
WE M 以 错误 概率 判定 语言 A。 换 名 话说， 模拟 M 得 到 错误 答案 的 概率 至 多 为 s。 我 们 
接 下 来 考虑 错误 概率 的 边界 。 错 误 概 率 的 边界 依赖 于 输入 串 的 长 度 2。 例 如 ， 错 误 概 率 s 王 
2 "表示 指数 地 小 的 错误 概率 。 

我 们 感 兴趣 的 是 在 时 间 和 空间 上 运行 高 效 的 概率 算法 。 度 量 概率 图 灵机 的 时 间 和 空间 
复杂 度 的 方法 与 度量 非 确 定型 图 灵机 的 一 样 ， 使 用 对 每 一 个 输入 的 最 坏 情 况 下 的 计算 
NER 


BPP 是 多 项 式 时 间 的 概率 图 灵机 以 错误 概率 二 判定 的 语言 类 。 





概率 图 灵 


我 们 以 错误 概率 二 定义 BPP。 但 是 根据 下 述 加 强 引 理 (amplification lemma)， 任 何 严 


格 地 在 0 和 二 之 间 的 常数 错误 概率 都 给 出 等 价 的 定义 。 这 个 引 理 提供 了 一 种 简单 的 方法 使 
错误 概率 指数 地 小 。 注 意 : 错误 概率 为 2-10 的 概率 算法 ， 由 于 运行 它 的 计算 机 的 硬件 失 
灵 ， 给 出 错误 结果 的 可 能 性 远大 于 由 于 柳 硬 币 不 走运 给 出 错误 结果 的 可 能 性 。 

Re 是 一 给 定 的 常数 ， 且 0<e 二 亏 。 又 设 Mi 是 一 台 错 误 概率 为 上 的 多 
项 式 时 间 概率 图 灵机 ， 则 对 于 任意 给 定 的 多 项 式 p(n), FES Mi 等 价 的 错误 概率 为 
2 ?的 多 项 式 时 间 概 率 图 灵机 M2。 

证 明 思路 ”Mz 用 如 下 方式 模拟 Mi : 运行 Mi 多 项 式 次 ， 并 且 取 这 些 运行 结果 中 的 多 
数 作为 计算 结果 。 错 误 概率 随 Mi 的 运行 次 数 指数 地 下 降 。 
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考虑 。 一 亏 时 的 情况 。 这 对 应 于 一 只 装 有 许多 红 球 和 蓝 球 的 盒子 。 已 知己 的 球 是 一 种 


颜色 ， 其 余 二 的 球 是 另 一 种 颜色 ， 但 是 不 知道 哪 一 种 颜色 的 球 多 。 随 机 地 抽取 若干 个 球 


(例如 ，100 个 )， 看 哪 一 种 颜色 的 频率 高 ， 以 此 能 够 检验 哪 一 种 颜色 多 。 几 乎 可 以 肯定 ， 
盒 中 数量 多 的 颜色 在 样本 中 的 频率 高 。 

这 些 球 对 应 Mi 的 计算 分 支 : 红色 对 应 接受 分 支 ， 蓝 色 对 应 拒绝 分 支 。Ms: 借助 运行 
Mi 对 颜色 取样 。 计 算 表 明 ， 如 果 Mz 运行 Mi ZAAK, 并且 输 出 出 现 频 率 高 的 结果 ， 则 
M2 犯错 误 的 概率 指数 地 小 。 


证 明 ”给 定 图 灵机 M 和 多 项 式 p), Mi 以 错误 概率 e 二 址 判定 一 个 语言 ， 要 构造 


下 述 图 灵机 M;， 它 以 错误 概率 2 2 判定 同一 语言 。 
MM 二 “对 输入 x: 
1. 计算 的 值 〈( 请 注意 下 面 的 分 析 )。 
2. 对 输入 工 进行 2k 次 独立 的 Mi 模拟 运行 。 
3. WR Mi 接受 工 的 次 数 多 ， 则 接受 ; 否则 拒绝 。” 
我 们 设法 限定 2 M: 在 输入 x 上 运行 错误 的 概率 。 阶 段 2 产生 一 个 由 模拟 Mi 得 到 的 
2k 个 结果 的 序列 ， 每 个 结果 要 人 么 正确 要 人 么 错误 。 如 果 这 些 结果 大 多 数 都 正确 ，M; 给 出 正 
确 的 回答 。 我 们 限定 概率 为 至 少 一 半 的 结果 都 是 错误 的 。 
假定 S 表示 阶段 2 M: 得 到 的 结果 序列 。 令 Ps 表示 M: 得 到 S 的 概率 。 假 定 S$ 中 
Ac 个 正确 的 结果 ，w 个 错误 的 结果 ,我们 有 ctr w=2k, WR Kw F H. M: 得 到 S， 那 
Z M: 输出 不 正确 。 我 们 把 这 样 的 序列 S 称 为 坏 的 序列 。 令 sz 是 Mi 在 x 上 出 错 的 概率 。 
如 果 S 是 一 个 坏 的 序列 ， 那 么 Psx le) Oer) o. MF erSex<il/2, PWe,Cl1—-e< 
e(l—-e), BHA cw, Peas Eeen Wik AN kw, exer MW e*(1—e)* 
CES TaT 
对 所 有 S 为 坏 序列 的 情况 Ps 求 和 ， 即 得 到 M: 输出 不 正确 的 概率 。 坏 序列 至 多 有 2% 
个 ， 这 是 显而易见 的 ， 因 为 所 有 不 同 序列 的 总 数 为 2 。 因 此 ， 得 到 如 下 等 式 : 
PrLM, 在 输入 工 上 输出 不 正确 ] 
- >X Ps I e et (1 — e)" = (4e(l —e))* 
坏 的 S 


由 于 假定 e 二 万， 我 们 有 4e(1 一 e) <1, 因此， 上述 概率 将 随 尼 的 增加 指数 地 减少 ， 
M 的 错误 概率 也 将 随 k 的 增加 指数 地 减少 。 为 得 到 一 个 特定 的 值 ， 使 得 我 们 能 很 好 地 
将 Ms 的 错误 概率 限定 在 小 于 2 (其 中 1), BATS a=— log (4e(1 一 e))， 并 选择 AE 
t/a, 于是， 我 们 得 到 多 项 式 时 间 内 的 错误 概率 2- zc 。 s 
10.2.2 素数 性 

素数 是 大 于 1 并 且 不 能 被 1 和 自身 以 外 的 任何 正 整数 除 尽 的 整数 。 大 于 1 的 非 素数 叫 


日 ”错误 概率 的 分 析 来 自 切 诺 夫 界 限 ， 这 是 概率 论 中 一 个 公认 的 标准 结果 。 这 里 我 们 给 出 一 个 替代 的 、 自 包含 的 
计算 ， 它 避免 了 对 该 结果 的 依赖 。 
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作 合 数 。 判 断 一 个 整数 是 素数 还 是 合 数 是 一 个 非常 古老 的 问题 ， 有 很 多 相关 的 研究 。 现 在 
已 经 有 了 解决 该 问题 的 多 项 式 时 间 算 法 L4j。 但 是 ， 由 于 种 种 原因 ， 可 能 不 适合 在 这 里 讲 
述 过 多 关于 该 工作 的 实现 细节 。 在 本 节 中 ， 我们 描述 一 个 简单 得 多 的 检验 一 个 数 是 素数 还 
是 合 数 的 多 项 式 时 间 概 率 算法 。 

判定 一 个 数 是 否 是 素数 ， 一 种 最 直接 的 方法 是 检查 所 有 小 于 这 个 数 的 整数 ， 看 是 否 有 
能 整除 这 个 数 的 数 ， 即 因子 。 由 于 数 的 大 小 是 随 它 的 长 度 呈 指数 增长 的 ， 故 这 个 算法 具有 
指数 时 间 复 杂 度 。 我 们 要 描述 的 测试 素数 性 的 概率 算法 的 运行 方式 完全 不 同 。 它 不 搜索 因 
子 。 实 际 上 ， 还 没有 找到 求 因子 的 多 项 式 时 间 概 率 算 法 。 

在 讨论 算法 之 前 ， 首 先 回顾 一 下 数论 中 的 某 些 表示 法 。 在 本 小 节 中 讨论 的 所 有 数 都 是 
整数 。 对 于 任 一 大 于 1 的 数 p， 如 果 两 个 数 仅 相差 p 的 整数 倍 ， 我 们 说 两 个 数 是 模 p 等 价 
的 。 如 果 x 和 yy ER p 等 价 的 ， 则 记 作 z=y(mod p). & x mod p 等 于 使 + 圭 y(mod p) 
的 最 小 非 负数 >。 为 方便 起 见 ， 令 Zy 表示 集合 {1,…,p 一 1}，Zb 表示 {0,…,p 一 1}， 则 
每 个 数 都 和 Z， 中 的 某 个 数 是 模 p 等 价 的 。 我 们 可 以 用 该 集合 以 外 的 数 表示 该 集合 中 与 之 
模 p 等 价 的 数 。 比 如 ， 可 以 用 一 1 表示 pl. 

算法 背后 的 主要 思想 源 于 下 述 费 马 小 定理 (Fermat’s little thereom)。 

如 果 pp 是 素数 ， 且 a€2Vi ， 则 a?-1 二 1(mod p). 

例如 ， 如 果 p= 二 7,a= 二 2， 则 定理 称 因 为 7 是 素数 ， 所 以 2“ ?mod 7 一定 等 于 1。 经 过 
简单 几 步 计算 


We = 28 = §4, 64 mod = 1 
可 以 证 实 这 个 结论 。 假 如 用 p=—6 inh, ALA, 
2 = d= 


得 到 的 结果 不 是 1。 根 据 这 个 定理 ，6 不 是 素数 。 当 然 ， 我 们 早已 知道 6 不 是 素数 。 但 是 ， 
这 个 方法 不 用 找到 它 的 因子 ， 就 能 证 明 6 是 合 数 。 问 题 10. 16 要 求 给 出 这 个 定理 的 证 明 。 
可 以 把 上 述 定理 看 作 一 种 “测试 ”素数 的 方法 ， 称 为 费 马 测试 (Fermat test). HR 
们 说 p 通过 在 a 的 费 马 测试 ， 是 指 az '=1 (mod p)。 该 定理 说 明 ， 任 意 素数 p 都 能 够 通 
过 关于 所 有 aEZ， 的 费 马 测试 。 观 察 发 现 6 不 能 通过 某 些 费 马 测试 ， 因 此 6 不 是 素数 。 
能 不 能 利用 费 马 测试 给 出 判定 素数 性 的 算法 ? 几乎 可 以 。 如 果 一 个 数 能 够 通过 所 有 关 
于 小 于 它 且 与 它 互 素 的 数 的 费 马 测试 ， 则 称 这 个 数 是 伪 素 数 (pseudoprime)。 除 了 相对 来 
说 少量 的 卡 米 切 尔 数 (Carmichael number) 外 ， 所 有 的 伪 素 数 都 是 素数 。 卡 米 切 尔 数 是 
合 数 ， 但 能 通过 所 有 上 比 它 小 且 互 素 的 数 的 费 马 测试 。 下 面 首 先 给 出 测试 伪 素 数 的 多 项 式 时 
间 概 率 算 法 ， 然 后 给 出 能 够 完全 测试 素数 性 的 多 项 式 时 间 概 率 算法 。 
判定 一 个 数 是 否 具 有 伪 素 数 性 ， 要 对 之 进行 全 部 的 费 马 测试 ， 因 此 判定 伪 素 数 性 的 算 
法 需要 指数 时 间 。 多 项 式 时 间 概 率 算 法 的 关键 是 ， 如 果 一 个 数 不 是 伪 素 数 ， 则 它 至 少 不 能 
通过 全 部 费 马 测试 的 一 半 。( 我 们 暂时 接受 这 个 断言 。 问 题 10. 14 要 求 给 出 它 的 证 明 。 算 
法 随机 进行 在 干 次 测试 。 如 果 有 一 次 测试 没有 通过 ， 则 这 个 数 一 定 是 合 数 。 如 果 测 试 都 通 
过 ， 则 这 个 数 很 可 能 是 一 个 伪 素 数 。 算 法 含有 一 个 用 来 确定 错误 概率 的 参数 ko 
PSEUDOPRIME= “Xt #iiA p: 
1. 在 Zs 中 随机 地 选取 al,…，,ak。 
2. 对 于 每 一 个 i， 计 算 a?’ mod p. 


3. 如 果 所 有 计算 值 都 等 于 1， 则 接受 ; 否则 拒绝 。” 
如 果 p 是 伪 素 数 ， 则 它 能 通过 全 部 测试 ， 从 而 算法 一 定 会 接受 。 如 果 p 不 是 伪 素 数 ， 
则 它 至 多 能 通过 全 部 测试 的 一 半 。 在 这 种 情况 下 ， 它 通过 每 一 个 随机 选择 的 测试 的 概率 不 


大 于 元。 于 是 ， 它 通过 全 部 k 个 随机 选择 的 测试 概率 不 大 于 2-*。 因 为 模 指数 是 多 项 式 时 


间 内 可 计算 的 〈 见 问题 7. 40) ， 故 这 个 算法 在 多 项 式 时 间 内 运行 。 

为 了 把 这 个 伪 素 数 性 算法 转换 成 素数 性 算法 ， 我 们 引入 更 为 复杂 的 测试 ， 以 避免 卡 米 
切 尔 数 带 来 的 问题 。 基 本 原理 是 ， 对 于 任 一 素数 p，1 恰好 有 两 个 模 p 的 平方 根 ， 即 1 和 
一 1。 对 于 许多 合 数 ， 包 括 所 有 的 卡 米 切 尔 数 在 内 ，1 有 4 个 或 更 多 的 平方 根 。 例 如 ， 士 1 
和 士 8 是 1 模 21 的 4 个 平方 根 。 如 果 一 个 数 通过 在 a 的 费 马 测试 ， 则 算法 随机 地 求 1 模 这 
个 数 的 一 个 平方 根 ， 并 且 看 这 个 平方 根 是 否 是 1 或 一 1。 如 果 不 是 ， 则 这 个 数 不 是 素数 。 

如 果 p 通过 在 a 的 费 马 测试 ， 由 于 a? mod p=1, Mili aT mod p 是 1 的 一 个 平方 
根 。 如 果 这 个 值 仍 是 1， 则 可 以 重复 用 2 除 指数 ， 只 要 得 到 的 指数 仍 是 整数 ， 然 后 看 第 一 
个 不 为 1 的 值 是 一 1， 还 是 某 个 其 他 的 数 。 下 面 描述 这 个 算法 ， 并 且 给 出 它 的 正确 性 的 形 
式 证 明 。 取 & 宇 1 作为 一 个 参数 ， 它 确定 最 大 错误 概率 为 2。 

PRIME 二 “对 输入 p: 

1. Æ 2p 是 偶数 ， 则 如 果 p=2, Wee; 否则 拒绝 。 
E Z) 中 随机 地 选取 a1,… ,ax 
H i=l, =ke 
计算 at :mod p， 并 且 如 果 不 等 于 1， 则 拒绝 。 
令 p 一 1 二 s。2:， 其 中 :是 奇数 。 
6. 计算 序列 a 2 as a a al T mod p。 
如 果 该 序列 中 的 某 个 数 不 等 于 1， 则 找到 最 后 一 个 不 等 于 1 的 数 。 如 果 这 
个 数 不 等 于 一 1， 则 拒绝 。 
8. 这 时 已 经 通过 全 部 测试 ， 故 接受 。” 

下 述 两 个 引 理 证 明 算 法 PRIME 是 正确 的 ， X p 是 偶数 时 ， 算 法 显然 正确 。 因 此 我 们 
只 需 考 虑 当 p 为 奇数 时 的 情况 。 如 果 算 法 PRIME 使 用 a; 在 步骤 4 或 步骤 7 拒绝 ， 则 称 a; 
是 一 个 ( 合 数 性 ) 见证 ((compositeness) witness), 

如 果 轧 是 一 个 奇 素数 ， 则 PrLPRTME 接受 力 ] 一 1。 

证 明 首先 要 证 明 如 果 p 是 素数 ， 则 不 存在 见证 ， 因 而 不 存在 算法 的 拒绝 分 支 。 如 果 
a 是 步 又 4 中 的 见证 ， 即 a?-!mod p 了 关 1， 根 据 费 马 小 定理 ，p 是 合 数 。 如 果 a 是 步骤 7 中 
的 见证 ， 则 存在 DE Zs 使 得 6 关 土 1(mod p) All b?=1(mod p). FÆ, b? -1=0(mod p). 
因子 分 解 及 一 1， 得 到 

(6—1)(6+1) = 0(mod p) 
因而 存在 正 整 数 c， 使 得 
(b—1)(6+1) = cp 
因为 6A 1(mod p)， 所 以 5 一 1 和 2 十 1 都 严格 地 在 0 和 p 之 间 。 而 一 个 素数 的 倍数 不 能 
表示 成 小 于 它 的 数 的 乘积 ， 故 p BAR. s 
下 述 引 理 显示 算法 以 很 高 的 概率 识别 合 数 。 首 先 ， 我 们 引用 数论 中 的 一 个 重要 的 基本 
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工具 。 如 果 两 数 没 有 除 1 以 外 的 公 因 数 ， 则 说 两 数 互 素 。 中 国 剩 余 定理 (Chinese remainder 
thereom) KH, WR p 和 9 BR, WH Zm 和 Zp XZ, 间 存 在 一 一 映射 。 每 个 数 € Zp, 对 
应 于 一 个 对 (a,b)， 其 中 a€ Zs ,bE Vo， 使 得 r 寺 a(mod p), H r=b(mod q). 

如 果 pp 是 一 个 奇 合 数 ， 则 Pr[PRIME #€ p]<2-*, 

证 明 WFR, WR p 是 奇 合 数 ，a 是 从 Zs 中 随机 选取 的 一 个 数 ， 则 


Pr[a 是 一 个 见证 ] > 


这 只 需要 证 明 在 Z。 中 见证 至 少 和 非 见 证 一 样 多 。 为 此 ， 对 每 一 个 非 见 证 我 们 设法 找到 一 
个 与 它 对 应 的 独 有 的 见证 。 

对 于 每 一 个 非 见 证 ， 在 步骤 6 中 计算 的 序列 要 么 都 是 1， 要 么 含有 一 个 一 1， 这 个 一 1 的 
后 面 跟着 1。 例 如 ，1 本 身 是 第 一 类 非 见证 。 由 于 * 是 奇数 ，( 一 1)…? =l 且 ( 一 1)s*? =1, 
故 一 1 是 第 二 类 非 见 证 。 在 所 有 第 二 类 非 见 证 中 ， 找 出 一 个 一 1 在 序列 中 的 最 大 位 置 的 非 
见证 。 设 这 个 非 见 证 是 hh， 一 1 在 它 的 序列 中 的 位 置 为 ;， 这 里 序列 位 置 从 ORR. FH, 
hs*?’ =—1(mod p). 

由 于 2p 是 合 数 ， 所 以 或 者 p 是 一 个 素数 的 窒 ， 或 者 可 以 把 它 写成 两 个 互 素 的 数 g 和 7 
的 乘积 。 我 们 首先 考虑 后 一 种 情况 。 根 据 中 国 剩余 定理 ， 在 Z。 中 存在 一 个 数 上 ， 使 得 

t =h(mod q) 
t =1(mod r) 
因此 ， 
12? =— 1(mod q) 
t? =1(mod r) 
Ky t? A+1(mod p) 但 是 #"?” 三 1(mod p)， 所 以 1 是 一 个 见证 。 

现在 我 们 得 到 了 一 个 见证 ， 还 可 以 得 到 更 多 的 见证 。 根 据 下 述 两 点 观察 ， 可 以 证 明 对 
于 每 一 个 非 见证 d, dt mod p 是 与 它 对 应 的 独 有 的 见证 。 首 先 ， 根 据 选 择 j 的 方式 ， 必 ' 2 = 
+1(mod p) 且 ds’? =1(mod p)。 因 此 ，dt mod p 是 一 个 见证 ， 因 为 (di):*? 关 土 1 而 且 
(dt)s*? =1(mod p) 

KK, WRd Md: 是 两 个 不 同 的 非 见 证 ， 则 dit mod p 关 dzt mod p。 这 是 因为 
tt?! mod p=1, Mi tett? -1 mod p= 二 1]。 所 以 ， 如 果 tdi mod p=td2 mod p, MI 
di =t.1"? d; mod = Es ix2 1d, mod p= dz 
所 以 ， 见 证 不 会 比 非 见 证 少 。 这 样 ， 我 们 证 明了 p REPRE YL 

对 于 方 是 一 个 素数 其 时 的 情况 ， 我 们 有 pHa, HH g 是 一 个 素数 ,se 二 1。 令 二 1 十 
qr !。 使 用 二 项 式 定 理 扩展 多 项 式 t? 可 以 得 到 

te = (1+) 二 1 十 p。g l +H 更 高 次 才 的 倍数 
这 和 1 mod p 是 等 价 的 。 因 此 ，z 是 一 个 阶段 4 见证 。 这 是 因为 : 如 果 ?1 二 1 (mod p), 
则 2?=t4l(mod p)。 像 前 一 个 例子 一 样 ， 可 以 用 这 个 见证 去 获取 其 他 很 多 见证 。 如 果 a 
是 一 个 非 见 证 ， 则 dz! 圭 1(mod p), FÆ, dt mod p 是 一 个 见证 。 更 进一步 ， 如 果 d 和 
d: 是 两 个 不 同 的 非 见 证 ， 则 dit mod p 关 dzt mod p, WW, 
dl = d, «t+ t! mod p = dz . tt |! mod p = dz 


因此 ， 见 证 的 数目 一 定 和 非 见 证 的 数目 一 样 多 ， 证 毕 。 a 

上 述 算法 及 对 它 的 分 析 给 出 下 述 定理 。 令 

PRIMES = {n| n 是 二 进 制 的 素数 ) 

PRIMESE BPP. 

注意 ， 这 个 素数 性 概率 算法 具有 单 侧 错误 (one-sided error) 。 当 算法 输出 拒绝 时 ， 输 
人 一定 是 合 数 ， 当 输出 接受 时 ， 我 们 只 知道 输入 可 能 是 素数 或 合 数 。 因 此 ， 只 有 当 输入 是 
合 数 时 ， 才 可 能 出 现 错误 的 回答 。 单 侧 错误 是 许多 概率 算法 的 共同 特点 ， 因 而 我 们 为 它 指 
定 一 个 专门 的 复杂 性 类 RP。 
RP 是 多 项 式 时 间 概 率 图 灵机 识别 的 语言 类 ， 在 这 里 ， 在 语言 中 的 输入 
以 不 小 于 三 的 概率 被 接受 ， 不 在 语言 中 的 输入 以 概率 1 被 拒绝 。 


用 类 似 于 引 理 10. 5 中 使 用 的 概率 加 强 技术 (实际 上 这 里 更 简单 些 )， 可 以 使 错误 概率 
指数 地 小 ， 并 且 保 持 多 项 式 运 行 时 间 。 前 面 的 算法 表明 COMPOSITESE RP, 


10.2.3 只 读 一 次 的 分 支 程序 

分 支 程 序 是 复杂 性 理论 和 某 些 实际 领域 (诸如 计算 机 辅助 设计 )〉 中 使 用 的 一 种 计算 模 
型 。 这 个 模型 表示 一 种 判定 过 程 ， 它 询问 输入 变量 的 值 ， 并 且 根 据 对 询问 的 回答 决定 如 何 
行进 。 我 们 把 这 样 的 判定 过 程 表示 成 一 个 图 ， 它 的 顶点 对 应 于 判定 过 程 中 在 该 点 询问 的 
变量 。 

本 小 节 考 察 检 验 两 个 分 支 程 序 是 否 等 价 的 复杂 性 。 一 般 来 说 ， 这 个 问题 是 coNP 完全 
的 。 如 果 对 分 支 程序 类 作 某 种 自然 的 限制 ， 则 能 够 给 出 检验 等 价 性 的 多 项 式 时 间 概 率 算 
法 。 基 于 下 述 两 个 原因 ， 我 们 对 这 个 算法 特别 感 兴趣 。 首 先 ， 不 知道 这 个 问题 的 多 项 式 时 
间 算 法 ， 因 而 这 是 明显 扩大 了 能 够 有 效 检验 成 员 资格 的 语言 类 的 一 个 概率 例子 。 其 次 ， 为 
了 分 析 布 尔 函 数 的 性 状 ， 算 法 引入 一 种 技术 ， 把 非 布 尔 值 赋 给 正常 的 布尔 变量 。 在 10.4 
节 将 会 看 到 ， 这 种 技术 在 交互 式 证 明 系 统 中 起 很 大 作用 。 

分 支 程 序 (branching program) 是 一 个 有 向 无 环 图 9 。 其 中 ， 除 两 个 输 
出 顶点 (output node) 被 标记 为 0 或 1 外， 它 的 所 有 顶点 都 被 标记 为 变量 。 被 标记 为 变量 
的 顶点 叫 作 查询 顶点 (query node) 。 每 一 个 查询 顶点 引出 两 条 边 ， 一 条 标记 0， 另 一 条 标 
记 1。 两 个 输出 顶点 没有 引出 的 边 。 在 分 支 程序 中 指定 一 个 顶点 为 起 始 顶点 。 

分 支 程序 能 够 确定 如 下 的 布尔 函数 。 对 查询 顶点 标记 的 所 有 变量 ， 任 取 一 个 赋值 ， 从 
起 始 顶 点 开始 ， 沿 途 在 每 一 个 查询 顶点 按照 赋 给 该 顶点 标记 的 变量 的 值 选择 一 条 引出 的 
边 ， 直 至 到 达 一 个 输出 顶点 为 止 。 分 支 程 序 的 输出 就 是 该 输出 顶点 的 标记 。 图 10- 1 给 出 了 
两 个 分 支 程序 的 例子 。 

分 支 程序 与 也 类 的 关系 类 似 于 布尔 电路 与 P 类 的 关系 。 问 题 10. 13 要 求证 明 多 项 式 个 
顶点 的 分 支 程序 能 够 检验 {0,1》 上 任何 属于 工 的 语言 的 成 员 资格 。 

如 果 两 个 分 支 程序 确定 的 函数 相同 ， 则 称 它们 是 等 价 的 。 问 题 10. 9 要 求证 明 检 验 两 
个 分 支 程序 等 价 的 问题 是 coNP 完全 的 。 这 里 考虑 分 支 程序 的 一 种 受 限 制 的 形式 ， 只 读 一 





O 有 向 图 如 果 没 有 有 向 环 ， 则 是 一 个 无 环 图 。 


BIOF AHR DAH 255 





图 10-1 两 个 只 读 一 次 的 分 支 程 序 


次 的 分 支 程 序 (read-once branching program) 是 这 样 一 种 分 支 程 序 ， 在 它 的 从 起 始 顶 点 
到 输出 顶点 的 每 一 条 有 回路 径 上 ， 每 一 个 变量 至 多 能 被 查询 一 次 。 图 10- 1 中 的 两 个 分 文 
程序 都 是 只 读 一 次 的 。 令 
EQrosp = {(Bi,Bz2) | Bi 和 Bs 是 两 个 等 价 的 只 读 一 次 的 分 支 程 序 》 
EQrosp Æ BPP 中 。 
证 明 思 路 ” 先 试 着 对 Bi MB: 中 出 现 的 所 有 变量 zi1,，… ,zm 赋 给 随机 的 值 ， 并 且 计 算 
这 两 个 分 支 程序 关于 这 个 赋值 的 输出 结果 。 如 果 Bl 和 Bs 关于 这 个 赋值 的 输出 结果 相同 ， 
则 接受 ; 否则 拒绝 。 但 是 ， 这 个 策略 是 行 不 通 的 。 因 为 两 个 不 等 价 的 只 读 一 次 的 分 支 程序 
可 能 只 对 变量 的 2” 个 可 能 赋值 中 的 一 个 赋值 不 一 致 ， 选 取 到 这 个 赋值 的 概率 指数 地 小 ， 
从 而 当 Bi 和 Bo 不 等 价 时 ， 也 可 能 以 大 概率 接受 ， 这 是 不 能 令 人 满意 的 。 
修改 这 个 策略 ， 改 成 对 变量 随机 地 选取 一 个 非 布 尔 赋值 ， 并 且 以 适当 规定 的 方式 计算 
Bı 和 B: 的 值 。 能 够 证 明 当 Bl 和 B: 不 等 价 时 ， 这 两 个 随机 计算 出 来 的 值 多 半 不 相等 。 
证 明 把 zi,…,zn 的 多 项 式 赋 给 只 读 一 次 的 分 文 程序 B 的 顶点 和 边 ， 步 又 如 下 : 把 
常数 函数 1 赋 给 起 始 顶 点 ， 如 果 标 记 工 的 顶点 已 经 被 赋 给 多 项 式 p， 则 把 多 项 式 cp KS 
从 这 个 顶点 引出 的 标记 1 的 边 ， 把 多 项 式 (1 一 zx)p 赋 给 从 这 个 顶点 引出 的 标记 0 的 边 。 
如 果 进 入 某 个 顶点 的 所 有 边 都 已 被 赋 给 多 项 式 ， 则 把 这 些 多 项 式 的 和 赋 给 这 个 顶点 。 把 赋 
给 标记 1 的 输出 顶点 的 多 项 式 赋 给 这 个 分 支 程 序 本 身 。 下 面 给 出 EQroBP 的 多 项 式 时 间 概 
率 算法 。 设 三 是 一 个 至 少 含有 3m 个 元 素 的 有 限 域 。 
D=“ Xt A (Bı.B2), Bi 和 Bs 是 两 个 只 读 一 次 的 分 文 程序 ; 
1. 在 大 中 随机 地 选取 m 个 元 素 al1，…，,am。 
2. 计算 赋 给 Bi 和 B 的 多 项 式 pi 和 p: Æ astram WE. 
3. 如 果 pi (al，… an) 一 加 (al，…am)， 则 接受 ; 否则 拒绝 。” 
由 于 计算 分 支 程序 的 多 项 式 的 值 不 必 真 的 构造 出 这 个 多 项 式 ， 这 个 算法 可 以 在 多 项 式 
时 间 内 运行 。 下 面 证 明 它 以 不 超过 二 的 错误 概率 判定 EQ. 
先 考察 分 支 程 序 B 与 赋 给 它 的 多 项 式 p 之 间 的 关系 。 注 意 ， 对 于 B 的 变量 的 任何 布 
尔 赋值 ， 赋 给 顶点 的 所 有 多 项 式 的 值 都 为 0 或 1。 所 有 值 为 1 的 多 项 式 都 在 对 应 这 个 赋值 


的 计算 路 径 上 。 因 此 ， 当 变量 取 布 尔 值 时 ，B 和 jp 的 值 相 同 。 类 似 地 ， 由 于 B 是 只 读 一 次 
的 ， 可 以 把 p 写成 积 项 yiyz ym 的 和 ， 这 里 每 一 个 yi 是 zi, (1 一 zi) 或 1， 而 且 每 一 个 
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积 项 对 应 于 B 中 一 条 以 起 始 项 点 到 标记 1 的 输出 顶点 的 路 径 。 当 一 条 路 径 不 含 变 量 x; 时 ， 
m= .yg 

Kp 的 每 一 个 这 种 含有 =l 的 积 项 ， 把 它 分 裂 成 两 个 积 项 的 和 和， 其 中 一 项 的 yi = 
fix IMN y Fl a 由 于 1 二 zi 十 (1 一 zi)， 这 样 得 到 一 个 等 价 的 多 项 式 。 继 续 分 裂 
积 项 ， 直 到 每 一 个 y; 为 zi 或 者 (1 一 xi) 为 止 。 最 后 得 到 一 个 等 价 的 多 项 式 9， 对 于 使 B 
等 于 1 的 每 一 个 赋值 ，g 含有 一 个 积 项 。 下 面 着 手 分 析 算 法 D 的 性 状 。 

首先 证 明 ， 如 果 Bi 和 B 等 价 ， 则 D 总 是 接受 。 如 果 两 个 分 支 程序 等 价 ， 则 它们 人 恰 
好 在 同样 的 赋值 取 值 为 1。 因 而， 多 项 式 q 和 qs 包含 的 积 项 完全 一 样 ， 两 者 相等 。 所 以 ， 
pi 和 po 在 每 一 个 赋值 都 相等 。 


其 次 证 明 ， 如 果 Bl 和 Bz 不 等 价 ， 则 D 拒绝 的 概率 不 小 于 亏 ， 这 个 结论 可 由 引 理 
10. 14 立即 得 到 。 ae 

前 面 的 证 明 依赖 下 述 引 理 。 它 涉及 随机 地 找到 多 项 式 的 一 个 根 的 概率 ， 这 个 概率 与 多 
项 式 的 变量 数 、 变 量 的 次 数 以 及 基础 域 的 大 小 有 关 。 

5 | #2 10 对 于 每 一 个 d 宇 0， 单 变量 工 的 d 次 多 项 式 p 或 者 最 多 有 d PR, RF 





处 处 等 于 0。 

WEAR 对 4 作 归 纳 。 

归纳 基础 : 对 d= 二 0 的 证 明 。0 次 多 项 式 是 一 个 和 常数， 如 果 这 个 常数 不 是 0， 则 多 项 式 
显然 没有 根 。 

VAR: 假设 引 理 对 da 一 1 成立 ， 要 证 明 对 & 成 立 。 如 果 p 是 不 恒 为 0 的 d 次 多 项 
式 ， 它 有 一 个 根 ar 则 z 一 “整除 办 。 于 是 ， 纪 (kz 一 67 EDES OW d 一 1 次 多 项 式 。 根 
据 归 纳 假设 ， 它 最 多 有 d—1 TR. i 
BFR f 个 元 素 的 有 限 域 ，p 是 X11，…,Xm 的 不 恒 为 0 的 多 项 式 ， 每 一 
不 变量 前 次 数 不 超 过 d. 如 果 ars sam 随机 地 选 自 大 ， 则 Pr[ plarsram) =O], 


f 

证 明 对 m 作 归纳 。 

归纳 基础 : 对 m= 的 证 明 。 根 据 引 理 10. 13，p 最 多 有 4 PR, Alia 是 一 个 根 的 
概率 不 超过 d/f. 

归纳 步骤 ; 假设 引 理 对 m 一 1 成 立 ， 要 证 明 对 m 成 立 。 设 zl 是 p 的 一 个 变量 。 对 于 
每 一 个 id, S pi 是 由 p PE ri 的 项 组 成 的 多 项 式 ， 但 这 里 ri 已 被 提出 来 。 于 是 

p= pezxipit zipst "+ xi pa 
如 果 pl(al,…,am) 二 0， 则 可 能 有 两 种 情况 。 或 者 所 有 pi 的 值 等 于 0 或 者 某 个 pi 的 值 不 等 
Fo, Ha 是 把 az,…,am 代入 poss ba 后 得 到 的 一 元 多 项 式 的 根 。 

对 于 第 一 种 情况 ， 由 于 p 不 恒 为 0, 一 定 有 一 个 pj; 不 恒 为 0。 于 是 ， 所 有 bpi 的 值 等 
于 0 的 概率 不 大 于 p; 的 值 等 于 0 的 概率 。 根 据 归 纳 假设 ， 因 为 p; 最 多 有 m 一 1 个 变量 ， 
故 这 个 概率 不 大 于 (m—1)d/f. 

对 于 第 二 种 情况 ， 如 果 某 个 pi 的 值 不 为 0， 则 把 a2，…,am RAR. p 化 简 成 单 变量 


zi 的 多 项 式 ， 它 不 恒 为 0。 归 纳 假设 已 经 证 明 a 是 这 个 多 项 式 的 根 的 概率 不 大 于 5， 


因此 ， Q1 9°** sam 是 多 项 式 p 的 根 的 概率 不 大 于 Cm—lid/ fia f=may fa ie 





BIOF AZER DAHA 257 


最 后 ， 在 算法 中 使 用 随机 性 时 ， 有 一 点 是 非常 重要 的 。 我 们 对 概率 算法 的 分 析 是 基于 
在 计算 时 有 可 供 使 用 的 真 随机 源 的 假设 的 。 但 是 ， 真 随机 源 可 能 是 很 难 〈 或 不 可 能 ) 获得 
的 ， 因 而 通常 用 伪 随 机 发 生 器 (psudorandom generator) 模拟 它 。 伪 随机 发 生 器 是 一 种 确 
定型 算法 ， 它 们 的 输出 好 像 是 随机 的 。 虽 然 任 何 确定 型 过 程 的 输出 绝 不 可 能 是 真 随机 的 ， 
但 是 某 些 确定 型 过 程 的 产生 结果 具有 随机 产生 结果 的 某 些 特征 。 随 机 性 的 算法 使 用 这 些 伪 
随机 发 生 需 时 ， 能 够 同样 好 地 工作 ， 但 是 证 明 一 般 是 非常 困难 的 。 实 际 上 ， 概 率 算 法 使 用 
某 些 伪 随 机 发 生 器 时 ， 有 时 不 能 很 好 地 工作 。 已 经 设计 出 非常 复杂 的 伪 随 机 发 生 器 ， 在 存 
在 单 向 函数 的 假设 下 ， 不 可 能 在 多 项 式 时 间 内 检验 出 它们 产生 的 结果 与 真 随机 结果 的 区 
Al, CIL 10. 6 WHF Hh] eH MITE.) 


10.3 交错 式 


交错 式 是 非 确定 性 的 推广 ， 在 解释 复杂 性 类 之 间 的 关系 和 对 具体 问题 按照 复杂 性 进行 
分 类 时 ， 交 错 式 已 被 证 明 非 常 有 用 。 利 用 交错 式 ， 我 们 能 够 简化 复杂 性 理论 中 的 各 种 证 明 
和 展示 时 间 与 空间 复杂 性 度量 之 间 惊 人 的 联系 。 

与 非 确 定型 算法 一 样 ， 交 错 式 算 法 可 以 含有 把 一 个 过 程 分 支 成 多 个 子 过 程 的 指令 。 两 
者 的 区 别 在 于 决定 接受 的 方式 。 如 果 有 一 个 初始 的 过 程 接 受 ， 非 确定 型 计算 就 接受 。 而 当 
一 个 交错 式 计算 分 成 多 个 过 程 时 ， 有 两 种 可 能 : 一 种 可 能 是 ， 算 法 规定 如 果 有 一 个 子 过 程 
接受 ， 则 当前 过 程 接受 ; 另 一 种 可 能 是 ， 规 定 如 果 所 有 的 子 过 程 接 受 ， 则 当前 过 程 接受 。 

用 树 表 示 产 生子 过 程 的 分 文 结 构 ， 可 以 形象 地 表现 交错 式 计算 和 非 确 定型 计算 之 间 的 
区 别 。 每 一 个 顶点 表示 过 程 中 的 一 个 格局 。 在 非 确 定型 计算 中 ， 每 一 个 顶点 做 它 的 儿子 的 
OR 运算 。 这 对 应 于 通常 的 非 确定 型 接受 方式 : 只 要 有 一 个 儿子 接受 ， 该 过 程 就 接受 。 在 
交错 式 计 算 中 ， 按 照 算 法 的 决定 ， 顶 点 可 以 做 AND 运算 或 OR 运算 ， 这 对 应 于 交错 式 计 
算 的 接受 方式 : 如 果 所 有 的 儿子 都 接受 ， 则 该 过 程 接受 ， 或 者 如 果 有 一 个 儿子 接受 ， 则 该 
过 程 接受 。 我 们 如 下 定义 交错 式 图 灵机 。 

交错 式 图 灵机 (alternating Turing machine) 是 一 种 具有 特殊 功能 的 非 确 
定型 图 灵机 。 除 qacept 和 qdreeet 外， 它 的 状态 分 成 全 称 状 态 (universal state) 和 存在 状态 
(existential state) 。 当 对 输入 串 运 行 交 错 式 图 灵机 时 ， 根 据 对 应 的 格局 是 包含 全 称 状 态 还 
是 包含 存在 状态 ， 用 人 或 V 标记 它 的 非 确定 型 计算 树 的 每 一 个 顶点 。 如 果 一 个 顶点 标记 人 
且 它 的 儿子 都 接受 ， 或 者 标记 V 且 它 的 儿子 中 有 一 个 接受 ， 则 指定 这 个 顶点 接受 。 如 果 起 
始 顶 点 被 指定 为 接受 ， 则 接受 输入 。 

图 10- 2 给 出 非 确定 型 计算 树 和 交错 式 计 算 树 。 交 错 式 计算 树 的 顶点 标 有 人 或 V ， 分 
别 表示 计算 儿子 的 AND 或 OR。 


10. 3. 1 交错 式 时 间 与 交错 式 空 间 
交错 式 图 灵机 的 时 间 复 杂 性 和 空间 复杂 性 的 定义 与 非 确定 型 图 灵机 的 一 样 ， 是 每 个 计 
算 分 支 所 用 的 时 间 和 空间 的 最 大 值 。 交 错 式 时 间 复 杂 性 类 和 空间 复杂 性 类 定义 如 下 : 
ATIME(t(n)) ={L|L 是 被 一 台 O(lti(n)) 时 间 的 交错 式 图 灵机 判定 的 语言 
ASPACE(f(n))={L|L 是 被 一 台 O(f(n)) 空间 的 交错 式 图 灵机 判定 的 语言 } 
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非 确 定型 交错 式 
图 10-2 非 确 定型 计算 树 与 交错 式 计 算 树 


定义 AP、APSPACE 和 AL 分 别 是 多 项 式 时 间 、 多 项 式 空间 和 对 数 空间 的 交错 式 图 灵 
机 判定 的 语言 类 。 
永 真 式 (tautology) 是 一 个 布尔 公式 ， 对 于 变量 的 每 一 个 赋值 ， 它 的 值 
都 等 于 1。 令 TAUT=((b) |$ 是 一 个 永 真 式 }。 下 述 交 错 式 算法 表明 TAUT 在 AP 中 。 
“对 输入 CA): 
1. 全 称 地 选取 对 y 的 变量 的 所 有 赋值 。 
2. 对 一 个 具体 的 赋值 ， 计 算 y 的 值 。 
3. 如 果 的 值 为 1， 则 接受 ; 否则 拒绝 。” 
算法 的 步骤 1 用 全 称 分 支 非 确 定性 地 选取 对 5 的 变量 的 每 一 个 赋值 。 这 样 ， 为 了 使 整 
个 计算 接受 ， 要 求 所 有 的 分 支 都 接受 。 步 又 2 和 3 确定 性 地 检查 在 一 个 具体 的 计算 分 支 中 
选取 的 赋值 是 否 满足 这 个 公式 。 因 此 ， 这 个 算法 如 果 确 认 所 有 的 赋值 都 是 满足 的 ， 则 接受 
它 的 输入 。 
注意 到 TAUT 是 coNP 的 一 个 成 员 。 事 实 上 ， 用 类 似 刚 才 的 算法 ， 可 以 很 容易 地 证 明 
coNP 中 的 任何 问题 都 在 AP 中 。 s 
这 个 例子 描绘 了 AP 中 的 语言 的 特点 ， 但 不 知道 它 是 在 NP 中 还 是 在 coNP 
中 。 回 想 一 下 问题 7. 21 中 定义 的 MIN FORMULA 语言 。 下 述 算法 表明 MIN-FORMULA 在 
AP 中 。 
“对 输入 《9$): 
1. 全 称 地 选取 所 有 比 $ 短 的 公式 y。 
2. 存在 地 选取 对 的 变量 的 一 个 赋值 。 
3. 计算 上 和 y 关于 这 个 赋值 的 值 。 
4. 如 果 这 两 个 公式 的 值 不 同 ， 则 接受 ; 如 果 这 两 个 公式 的 值 相同 ， 则 拒绝 。” 
算法 开始 时 ， 在 步骤 1 用 全 称 分 支 选 取 所 有 更 短 的 公式 ， 然 后 ， 在 步骤 2 转 到 存在 分 
支 选取 一 个 赋值 。 交 错 式 一 词 源 于 在 全 称 分 支 与 存在 分 支 之 间 交 错 或 转换 的 能 力 。 a 
交错 式 使 我 们 能 够 给 出 复杂 性 的 时 间 度 量 与 空间 度量 之 间 显 著 的 联系 。 粗 略 地 说 ， 下 
述 定理 说 明 ， 对 于 多 项 式 相关 的 界限 ， 交 错 式 时 间 与 确定 型 空间 等 价 ; 当时 间 界 限 指数 地 
多 于 空间 界限 时 ， 交 错 式 空间 与 确定 型 时 间 等 价 。 
对 于 fnn, A 
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ATIME( f(n)) CS SPACE(f(n)) CS ATIME( f? (n)) 

对 于 f(n)Slogn, A 

ASPACE( f(n)) = TIME(2°U™) ) 

Rutt, AL=P, AP=PSPACE 以 及 APSPACE=EXPTIME。 下 面 把 这 个 定理 的 证 明 
分 成 4 个 引 理 。 

TEC 对 于 fo) 三 *， 有 ATIME(F(a))SESPACE(CFCz))。 

证 明 把 OC(f(n)) 时 间 的 交错 式 图 灵机 M 转换 成 O(f(n)) 空间 的 确定 型 图 灵机 S, 
S 如 下 模拟 M: 对 于 输入 w，S 对 M 的 计算 树 做 深度 优先 搜索 ， 确 定 哪些 顶点 接受 。 如 果 
树 根 (对 应 起 始 格 局 ) 接受 ， 则 S 接受 。 

机 器 S 需要 空间 来 存储 在 深度 优先 搜索 中 使 用 的 递归 栈 。 递 归 的 每 一 层 存储 一 个 格 
局 。 递 归 的 深度 是 M 的 时 间 复 杂 度 。 每 一 个 格局 使 用 O(f(n)) 空间 ，M 的 时 间 复 杂 度 为 
O(f(n))。 因 此 ，S 使 用 O(f?(n)) 空间 。 

注意 到 S 在 递归 的 每 一 层 不 需要 存储 整个 格局 ， 因 而 可 以 改进 它 的 空间 复杂 度 。 代 和 替 
存储 整个 格局 的 是 ， 只 记录 M 从 上 一 格局 到 这 个 格局 时 所 做 的 非 确定 型 选择 。 然 后 ， 通 
过 多 次 执行 从 头 开 始 的 计算 ， 并 按照 记录 的 “路 标 ” 进 行 ，S 可 以 找到 这 个 格局 。 这 样 把 
在 递归 的 每 一 层 空间 的 使 用 减少 到 和 常数。 于 是 ， 整 个 使 用 的 空间 为 O(f(n))。 z 

对 于 fn) >n, A SPACE(f(n))CATIME( P (n)). 

证 明 从 一 台 O(f(n)) 空间 的 确定 型 图 灵机 M 出 发 ， 构 造 一 台 交 错 式 图 灵机 S， 用 
OC f? (n)) 时 间 模 拟 它 。 方 法 类 似 于 在 萨 维 奇 定 理 〈 和 定理 8.5) 的 证 明 中 使 用 的 方法 ， 在 
那里 构造 了 一 个 关于 可 产生 性 问题 的 一 般 过 程 。 

在 可 产生 性 问题 中 ， 任 给 M 的 两 个 格局 cl co 和 一 个 数 :， 要 检验 M 是 否 能 在 上 步 内 
从 cl 得 到 cs 。 关 于 这 个 问题 的 交错 式 过 程 ， 首 先 存 在 地 分 支 去 猜想 cl 和 cz 之 间 的 格局 
cm 。 然 后 全 称 地 分 支 成 两 个 过 程 ， 一 个 递归 地 检验 在 t/2 步 内 cl 是 否 能 得 到 c" ， 另 一 个 
递归 地 检验 在 t/2 步 内 c 是 否 能 得 到 c，。 

机 器 S 用 这 个 交错 式 递 归 过 程 检 验 起 始 格 局 在 2Y 步 内 是 否 能 到 达 一 个 接受 格局 。 
这 里 ， 选 取 d 使 得 M 在 它 的 空间 界限 内 的 格局 数 不 超过 27, 

该 交错 式 过 程 的 每 一 个 分 支 使 用 的 最 大 时 间 等 于 在 递归 的 每 一 步 写 一 个 格局 的 时 间 
OC f(n) ) Fe VA 336 VA AY RE BE log =OCFGz))。 因 此 ， 算 法 在 交错 式 时 间 OCF (n)) 内 
运行 。 aa 

对 于 f(n)>Slogn, # ASPACE( f(n))CTIME(29°U™ » , 

证 明 构造 一 台 20A 时 间 的 确定 型 图 灵机 S， 模 拟 OCf™) 空间 的 交错 式 图 灵机 
M。 对 于 输入 w,S 构造 M 对 w 的 计算 图 如 下 。 顶 点 集 是 M 关于 w 的 所 有 格局 ， 每 一 顶 
点 最 多 使 用 d(f(n)) Sl, XB, 是 某 个 适合 于 M 的 常数 因子 。 从 每 一 个 格局 到 MB 
动 一 步 所 得 到 的 格局 连 一 条 边 。 构 造 图 之 后 ，S 反复 扫描 这 个 图 ， 给 某 些 顶 点 作 接 受 的 记 
号 。 一 开始 ， 仅 给 M 真正 的 接受 格局 作 记 号 。 如 果 一 个 执行 全 称 分 支 的 格局 的 所 有 儿子 
都 有 记号 ， 则 给 它 作 记号 ; 如 果 一 个 执行 存在 分 支 的 格局 有 一 个 儿子 有 记号 ， 则 给 它 作 记 
号 。 机 器 S 连续 扫描 和 作 记 号 ， 直 到 在 一 次 扫描 中 没有 给 顶点 作 记 号 为 止 。 最 后 ， 如 果 M 
KF w 的 起 始 格局 作 了 记号 ， 则 SKZ. 

由 于 f(n) Slog mw，M 关 于 也 的 格局 数 为 2242) 。 因 此 计算 图 的 大 小 为 22) ， 可 
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在 20 时 间 内 构造 它 。 扫 描 一 次 差不多 也 用 同样 的 时 间 。 因 为 除 最 后 一 次 外 ， 每 扫 
描 一 次 至 少 给 一 个 顶点 作 记 号 ， 故 扫描 的 总 次 数 不 超 过 顶点 数 。 因 此 ,使 用 的 总 时 间 为 
OFC) ， a 
对 于 f(n)>Slog n, A ASPACE( f(n)) DTIME (204 ) 。 
证 明 要 说 明 交 错 式 图 灵机 SHOS) 空间 模拟 207 时 间 的 确定 型 图 灵机 
M。 这 个 模拟 是 有 点 难 办 的 ， 因 为 S 可 使 用 的 空间 比 
M 的 计算 长 度 要 小 很 多 。 这 里 ，S 只 有 足够 的 空间 存 
储 进 入 M Æw 上 运行 的 画面 的 指针 ， 如 图 10- 3 所 示 。 
采用 定理 9.25 证 明 中 给 出 的 格局 表示 法 ， 一 个 符 
号 可 以 既 表 示 机 器 的 状态 ， 又 表示 读 写 头 下 的 带 单元 的 
内 容 。 在 图 10- 3 中 ， 单 元 4 的 内 容 取 决 于 它 的 父辈 a、 2m 
和 的 内 容 ( 左 、 右 边界 上 的 单元 只 有 两 个 父辈 ) 。 
S 递归 地 进行 ， 猜 想 并 验证 画面 中 各 个 单元 的 内 
容 。 如 果 单 元 4 不 在 第 一 行 ， 为 了 验证 单元 4 的 内 容 ， 
S 存在 地 猜想 它 的 父辈 的 内 容 。 按 照 M 的 转移 函数 ， 
验证 这 些 内 容 是 否 能 产生 4 的 内 容 。 然 后 ，S 全 称 地 
分 支 去 递归 地 验证 这 些 猜 想 的 内 容 。 如 果 d 在 第 一 行 ， 
因为 知道 M 的 起 始 格 局 ，S 直接 地 验证 d 的 内 容 。 可 以 假设 M 在 接受 时 把 它 的 读 写 头 移 
到 带 的 左 端 ， 因 此 ，S 通过 验证 画面 左下 方 单元 的 内 容 ， 能够 确定 M 是 否 接 受 w。 从 而 ， 
S 只 需要 存储 一 个 指向 画面 中 一 个 单元 的 指针 ， 故 使 用 的 空间 为 log20(f( =O f(n)). m 


10. 3.2 多 项 式 时 间 层 次 

交错 式 图 灵机 提供 了 一 种 手段 ， 在 PSPACE 类 中 定义 一 个 类 的 自然 层次 。 

RiR- RR, D 交错 式 图 灵机 是 以 存在 步骤 开始 ， 在 每 一 个 输入 
和 每 一 个 计算 分 支 上 最 多 含有 1i 次 全 称 步 骤 与 存在 步骤 轮换 的 交错 式 图 灵机 。 开 ; 交错 式 图 
灵机 与 此 类 似 ， 只 是 它 以 全 称 步骤 开始 。 

令 iTIME(f(n)) AS: 交错 式 图 灵机 在 OC(f(n)) 时 间 内 可 判定 的 语言 类 。 类 似 地 ， 
MF; 交错 式 图 灵机 定义 TTiTIME(f(n)) 类 。 对 于 空间 界限 的 交错 式 图 灵机 定义 
3;SPACE(f(n)) 类 和 JiSPACE(f(n))。 下 述 语言 类 集合 称 作 多 项 式 时 间 层 次 (polyno- 


mial time hierarchy) : 


DOAS) 











图 10-3 表示 M 在 w 上 运行 的 画面 


5:P =U Si TIME(n*) 

IP =) Hi TIME) 
我 们 定义 类 PH= USi:P=UOiP. BR, NP=DiP, MAH coNP=MP. tsb, MIN-FOR- 
MULA E IP. | | 


10.4 交互 式 证 明 系统 


交互 式 证 明 系 统 提供 了 一 种 定义 类 似 NP 的 概率 语言 类 的 手段 ， 这 很 像 多 项 式 时 间 概 
率 算法 给 出 类 似 P 的 概率 语言 类 。 交 互 式 证 明 系 统 的 开发 对 复杂 性 理论 产生 了 深刻 的 影 
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啊 ， 给 密码 学 和 近似 算法 这 两 个 领域 带 来 了 重大 进展 。 为 了 体会 一 下 这 个 新 概念 ， 我 们 重 
新 对 NP 作 点 直观 的 分 析 。 

NP 中 的 语言 是 这 样 的 一 些 语 言 : 它们 的 成 员 都 有 容易 验证 的 短 的 资格 证 书 。 如 果 需 
要 的 话 ， 请 回 到 7. 3 节 ， 重 温 一 下 对 NP 的 系统 阐述 。 现 在 重新 简洁 地 描写 这 个 系统 阐 
述 ， 这 次 增添 两 个 新 东西 : 一 个 证 明 者 和 一 个 检验 者 ， 前 者 寻找 成 员 资 格 的 证 明 ， 后 者 验 
证 证 明 。 设 想 证 明 者 好 像 正 在 设法 使 检验 者 相信 w 是 A 的 成 员 。 要 求 检验 者 是 一 台 多 项 
式 时 间 界 限 的 图 灵机 ， 否 则 ， 它 自己 就 能 够 给 出 答案 。 对 证 明 者 不 加 任何 计算 界限 ， 因 为 
寻找 证 明 是 相当 耗 时 的 。 

以 SAT 问题 为 例 。 证 明 者 可 以 提供 一 个 满足 的 赋值 ， 使 多 项 式 时 间 的 检验 者 相信 公 
式 $ 是 不 可 满足 的 。 证 明 者 能 够 类 似 地 使 计算 有 限制 的 检验 者 相信 一 个 公式 是 不 可 满足 的 
吗 ? 由 于 不 知道 SAT Æ NP 中 的 补 ， 因 此 不 能 依赖 上 述 证 明 思 想 。 然 而 ， 假 如 给 证 明 者 
和 检验 者 添加 两 个 额外 的 特性 ， 令 人 惊奇 地 发 现 答案 是 肯定 的 。 首 先 ， 人 允许 它们 进行 双向 
对 话 。 其 次 ， 检验 者 可 以 是 一 台 多 项 式 时 间 的 概率 图 灵机 ， 它 以 很 大 的 把 握 (但 不 是 绝对 
的 把 握 ) 做 出 正确 的 回答 。 这 样 一 对 证 明 者 和 检验 者 构成 一 个 交互 式 证 明 系统 。 


10. 4.1 图 的 非 同 构 


我 们 用 一 个 漂亮 的 例子 一 一 图 同 构 问 题 来 阐明 交 互 式 证 明 概 念 。 如 果 能 够 重新 安排 G 

的 顶点 的 顺序 ， 使 得 它 与 五 一 样 ， 则 称 图 GSH 同 构 〈isomorphic) 。 令 

ISO = {(G, H>) |GRH ž AAi t i A) 
RR ISO 显然 在 NP 中 ， 但 是 至 今 没 有 找到 这 个 问题 的 多 项 式 时 间 算 法 ， 也 没有 证 明 它 是 
NP 完全 的 。 它 是 NP 中 尚未 确定 位 置 的 、 为 数 不 多 的 自然 问题 中 的 一 个 。 
这 次 考虑 TSO 的 补 ， 即 语言 
NONISO = {(G,H)|G 和 五 是 两 个 不 同 构 的 图 } 

由 于 不 知道 如 何 提 供 两 个 图 不 同 构 的 短 的 证 书 ， 故 不 知道 NONISO 在 NP 中 。 然 而 ， 当 
两 个 图 不 同 构 时 ， 正 如 将 要 证 明 的 那样 ， 证 明 者 能 够 使 检验 者 相信 这 个 事实 。 

假设 有 两 个 图 G 和 Gzs 。 如 果 它 们 同 构 ， 证 明 者 提供 它们 的 同 构 映射 ， 即 顶点 的 重新 
排列 ， 能 够 使 检验 者 相信 这 个 事实 。 但 是 ， 如 果 它 们 不 同 构 ， 证 明 者 怎么 使 检验 者 相信 
呢 ? 不 要 忘记 : 检验 者 不 一 定 相 信 证 明 者 ， 因 此 对 于 证 明 者 来 说 ， 仅 仅 说 它们 不 同 构 是 不 
够 的 。 证 明 者 必须 使 检验 者 信服 才 行 。 考 虑 下 述 简短 的 协议 。 

检验 者 随机 地 选择 G1 或 Gzs ， 随 机 地 重新 排列 它 的 顶点 ， 得 到 图 H., BRA H% 
给 证 明 者 ， 证 明 者 必须 回答 H 是 由 Gil 还 是 由 G2 得 到 的 。 这 就 是 整个 协议 。 

如 果 Cl 和 Gz 确实 不 同 构 ， 证 明 者 总 能 够 执行 协议 ， 因 为 它 能 够 区 分 五 是 来 自 G1 还 
是 来 自 Cs 。 但 是 ， 如 果 两 个 图 同 构 ， 则 H 可 能 来 自 G1， 也 可 能 来 自 G;。 因 而 即使 不 限 
制 计算 能 力 ， 证明 者 给 出 正确 回答 的 机 会 也 不 会 好 于 一 半 对 一 半 。 于 是 ， 如 果 证 明 者 能 够 
始终 如 一 地 正确 回答 (例如 ， 重 复 100 次 协议 )， 则 检验 者 获得 两 个 图 确实 不 同 构 的 令 人 
信服 的 证 据 。 


10.4.2 模型 的 定义 


为 了 形式 地 定义 交互 式 证 明 系统 模型 ， 描 述 检验 者 、 证 明 者 以 及 它们 的 相互 作用 。 我 
们 会 发 现 ， 记 住 图 的 非 同 构 这 个 例子 是 有 用 的 。 定 义 检验 者 (Verifier) 是 一 个 函数 V， 
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它 根据 至 今 传 递 的 信息 历史 ， 计 算 下 一 次 传送 给 证 明 者 的 信息 。 郴 数 立 有 3 个 输入 : 

1. 输入 串 。 我 们 的 目标 是 确定 这 个 字符 串 是 否 是 某 个 语言 的 成 员 。 在 NONISO 例子 
中 ， 输 入 串 是 两 个 图 的 编码 。 

2. 随机 输入 。 为 了 便于 给 出 定义 ， 给 检验 者 提供 一 个 随机 选取 的 输入 串 ， 用 来 代替 
在 计算 中 做 概率 动作 的 能 力 。 两 者 是 等 价 的 。 

3. 部 分 信息 历史 。 郴 数 不 能 存储 已 进行 过 的 对 话 。 因 此 ， 通 过 用 一 个 字符 串 表 示 到 
现在 为 止 交换 的 信息 来 提供 额外 的 存储 能 力 。 用 记号 mi Home Hs Hm: 表示 交换 信息 
m)°°*™Mi o 
检验 者 的 输出 或 者 是 序列 中 的 下 一 个 信息 m;+1， 或 者 是 指明 交互 作用 的 结果 : 接受 
或 拒绝 。 于 是 V 的 函数 形式 为 Vw:3* X5* X5* 一 >5* (接受 ,拒绝 )。 

Vlw,rsm 井 … 井 ?2i) 一 mi+1 表 示 输 入 串 为 记 ， 随 机 输入 为 >， 当前 的 信息 历史 为 m 
到 mi, 以 及 检验 者 给 证 明 者 的 下 一 个 信息 为 Mi+1 o 

证 明 者 (Prover) 的 计算 能 力 是 无 限 的 。 定 义 它 为 一 个 函数 P， 有 两 个 输入 : 

1. 输入 串 。 

2. 部 分 信息 历史 。 

证 明 者 的 输出 是 给 检验 者 的 下 一 个 信息 。 形 式 地 ，P 的 形式 为 P:3* X53* 一 >3*。 

Prwmi $= # m;) = mi+1 表示 在 交换 信息 misom 之 后 ， 证 明 者 把 mi+1 送 给 检 
验 者 。 

现在 定义 证 明 者 和 检验 者 之 间 的 交互 作用 。 对 于 给 定 的 字符 串 w 和 x， 如 果 存 在 信息 
序列 ml ，… ,mx ， 使 得 

1. 当 0Ni<k Hi 为 偶数 时 ，V(wyrymi He Hm) =mi413 

2. 当 0<i<k Hi AAA, PCw,sm ° #m:)=mi+1; 

3. 该 信息 历史 中 的 最 后 一 个 信息 mx 是 接受 。 

则 记 作 (Ye>P)(w,r) 王 接受 。 

为 了 简化 IP 类 的 定义 ， 假 设 检验 者 的 随机 输入 和 检验 者 与 证 明 者 之 间 交 换 的 每 一 个 
信息 的 长 度 都 是 p(n)， 这 里 p 是 仪 与 检验 者 有 关 的 多 项 式 。 此 外 ， 还 假设 交换 的 信息 总 
数 不 超 过 如 (z) 。 下 述 定义 给 出 交互 式 证 明 系 统 接受 输入 串 w 的 概率 。 对 于 任意 长 度 为 
NFB w, EM 

Pr[VeP 接受 w] = Pr (VP) (wor) = 接受 ] 
其 中 r 是 随机 选取 的 长 度 为 p(n) 的 字符 串 。 

如 果 存 在 一 个 多 项 式 时 间 可 计算 函数 V， 使 得 对 任意 函数 P、 函 数 P 

和 字符 串 w, 


1. wE A 8 PrlVoP HZ w]> 


2. wA iH Pr[VeP 接受 w]< 


o o 


则 说 语言 A 在 IP 中 。 
换 名 话说， 如 果 wE A， 则 某 个 证 明 者 (一 个 “诚实 的 ”证 明 者 ) 能 使 检验 者 以 高 


概率 接受 ; 但 如 果 wF A， 则 没有 证 明 者 (一 个 “不 诚实 的 ”证 明 者 P) 能 够 使 检验 者 以 
高 概率 接受 。 
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可 以 像 在 引 理 10. 5 中 使 错误 概率 指数 地 小 那样 ， 通 过 反复 运行 ， 放 大 交互 式 证 明 系 
统 的 成 功 概率 。 显 然 ，IP 包含 NP 类 和 BPP 类 ， 我 们 还 证 明了 它 包 括 语言 NONISO, 但 
不 知道 NONISO 在 NP 还 是 BPP 中 。 下 面 将 要 证 明 ，IP 类 出 人 意料 地 大 ， 它 等 于 
PSPACE 类 ， 


10.4.3 IP=PSPACE 


本 节 证 明 复 杂 性 理论 中 一 个 著名 的 定理 : IP 类 与 PSPACE 类 相等 。 于 是 ， 对 于 
PSPACE 中 的 任 一 语言 ， 证 明 者 能 够 使 多 项 式 时 间 的 概率 检验 者 相信 该 语言 中 字符 串 的 成 
员 资 格 ， 而 这 种 成 员 资格 的 常规 证 明 可 能 是 指数 长 的 。 

IP=PSPACE, 

把 这 个 定理 分 解 成 两 个 引 理 ， 分 别 给 出 一 个 方向 的 包含 关系 。 第 一 个 引 理 证 明 IPC 
PSPACE。 虽 然 有 一 点 技巧 ， 但 是 这 个 引 理 的 证 明 是 用 多 项 式 空间 的 机 颖 对 交互 式 证 明 系 
统 的 一 般 模 拟 。 

IPCPSPACE。 

证 明 设 A 是 IP 中 的 一 个 语言 。 假 设 当 输入 w 的 长 度 为 n 时 ，A 的 检验 者 V 恰好 交 
换 p 二 p(n) 个 信息 。 构 造 一 台 模 拟 V 的 PSPACE 机 器 M。 首 先 ， 对 任意 的 字符 串 w 定义 

Pr[V Æ $ w] = max Pr[V<>P #2 w] 


Y wHEA 中 时 ， 这 个 值 至 少 等 到， 当世 不 在 A 中 时 ， 至 多 等 于 二 。 下 面 说 明 如 何 


在 多 项 式 空 间 内 计算 这 个 值 。 用 M; 表示 信息 历史 mi #e pm. EV 与 P 交互 作用 的 定 
义 推 广 到 从 任意 信息 流 Mi 开始 。 如 果 能 够 用 信息 mj+1，… ,mp 扩充 Mi ， 使 得 

1. 40Ni<p Hi 为 偶数 时 ，V(Cwyryzal # #mi)=mi+1; 

2. 当 j 二 i 二 p Hi 为 奇数 时 ，P(w,mi 井 … 井 zmi) 一 Mai 二 1 

3. 该 信息 历史 中 最 后 一 个 信息 mp 是 接受 。 
则 记 作 (VP)(W,r,Mj)= 二 接受 。 

注意 ， 这 些 条 件 要 求 V 的 信息 和 Mi 中 已 经 存在 的 信息 保持 一 致 。 进 一 步 推广 早先 给 
出 的 几 个 定义 。 对 于 长 度 为 p 的 随机 串 r+， 定 义 

Pr[ 从 M; 开始 VP #€ 2% wi = Pr,L(Ve>P)(w,r,M;) = 接受 ] 
这 里 ， 为 了 以 后 证 明 的 需要 ， 我 们 引入 符号 Pr ， 它 表示 概率 是 考虑 所 有 和 Mi 上 信息 一 
致 的 串 ” 上 的 概率 。 如 果 不 存 在 这 样 的 >， 则 定义 概率 为 0。 然 后 定义 
PrL 从 Mi 开始 V 接受 wj] = max Prl A Mi 开始 Ve> 忆 接受 也 j 

对 每 一 个 0<j< 和 每 一 个 信息 流 Mi ， 从 j 二 p 开始 递减 j， 对 Nm 进行 归纳 定义 ， 
对 包含 p 个 信息 的 信息 流 M， 如 果 对 一 些 串 r+，M，。 和 VV 的 信息 一 致 并 且 mp 二 接受 ， 则 
& Nu, =1. Bal, F Nu, =0. 

对 二 p 和 一 个 信息 流 M;， 如 下 定义 Nm 。 

maxm.,, NM,,, 若 j 二 pp 且 为 奇数 
i ‘we avgm,, Nm,， @IS PHA HK 

这 里 wt-avgm,, NM,,, 表示 之 mw ， (Pr-LVCwyr, Mi ) 王 zi+1]。 Nm,,,)» 其 中 Pr, 表 示 在 长 度 
为 p 的 随机 串 > 上 取 到 的 概率 。 这 是 Nm ,以 检验 者 传送 信息 mj+1 的 概率 为 权重 的 平 


264 RABY 复杂 性 理论 


均值 。 

令 Mo 是 空 信息 流 。 下 面 给 出 关于 Nm 的 两 个 断言 。 首 先 ， 能 够 在 多 项 式 空间 内 计算 
Nm, 。 对 于 每 一 个 j 和 Mi ， 算 法 递归 地 计算 Nm 的 值 。 计 算 max, ,是 很 直接 的 。 为 计算 
wt-avgm ,, ， 我 们 需要 遍历 所 有 长 度 为 p 的 串 r+， 删 除 那些 使 得 检验 者 产生 与 Mi 中 的 信息 
不 一 致 输出 的 串 。 如 果 所 有 的 串 7 都 被 删除 了 ， 那 么 wt-avgm ,一 0。 如 果 有 些 串 保 留 下 
来 ， 我 们 确定 使 检验 者 输出 mj+1 的 那 部 分 串 ， 然 后 通过 计算 该 部 分 的 均值 来 确定 Nw ， 
的 权重 。 递 归 的 深度 为 p， 故 只 需要 多 项 式 空间 。 

其 次 ，Nw 等 于 PrLV 接受 wj]。 为 了 确定 w 是 否 在 A 中 需要 这 个 值 ， 下 面 用 归纳 法 
证 明 第 二 个 断言 。 本 

对 于 每 一 个 0<j 二 pp Mj, 

Nm, = Pr[ 从 Mi 开始 V 接受 ww] 

对 j 作 归 纳 证 明 。 归 纳 基础 是 7 二 p， 归 纳 从 p 到 0 逐步 进行 。 

归纳 基础 : 首先 证 明 j= p 时 断言 成 立 。m。 是 接受 或 者 拒绝 。 如 果 m, 是 接受 ， 则 
Nm 定义 为 1。 此 时 ， 由 于 信息 流 已 经 表明 接受 ， 故 PrL 从 Mi 开始 V 接受 wj]= 二 1。 因 此 ， 
断言 为 真 。 当 m, 是 拒绝 时 ， 与 此 类 似 。 

归纳 步骤 : 假设 对 于 7 十 1 委 训 和 任意 的 信息 流 Mj+1 断 言 为 真 。 要 证 明 断 言 对 j 和 任 
意 的 信息 流 Mi EJH. WR j 是 偶数 ， 则 mj; +1 是 V 传 给 P 的 信息 。 于 是 有 


1 
Nm, = >) (Pri[V Cw,r, Mj;) = mjm] + Nm,,,) 


Uai 


kal >) (Pr, [V(wsr,M;) = mj+ ] ° PrLA Mju 开始 V #X w])) 

= Pr[ 从 M; 开始 V EK w] 
等 式 1 是 Nm 的 定义 。 根 据 归纳 假设 有 等 式 2。 等 式 3 由 PrL 从 Mi 开始 V 接受 wj] 的 定义 
得 到 。 因 而 ， 当 7 是 偶数 时 ， 断 言 成 立 。 如 果 j; 是 奇数 ， 则 m E PAVENS. F 
是 有 


1 
Nm. = max Nm, 
J + 


DE 


1 


ies PrL 从 Mi+1 开始 V Zw] 
= Pr[ 从 M; 开始 V HS w] 
等 式 1 是 Nm 的 定义 。 等 式 2 使 用 归纳 假设 。 我们 把 等 式 3 分 成 两 个 不 等 式 。 由 于 使 下 限 
最 大 的 证 明 者 能 够 送出 使 上 限 最 大 的 信息 mj+1， 故 有 三 。 又 由 于 这 个 证 明 者 不 可 能 送出 
比 这 个 mj+1 更 好 的 信息 ， 故 有 宇 。 送 出 任何 不 使 上 限 最 大 的 信息 都 会 使 最 后 得 到 的 值 变 
小 。 这 就 证 明 当 7 为 奇数 时 断言 也 成 立 ， 从 而 完成 定理 10. 26 的 一 个 方向 的 证 明 。 = 
现在 证 明 该 定理 的 另 一 个 方向 。 这 个 引 理 的 证 明 引 入 一 个 新 的 分 析 计 算 的 代数 方法 。 
PSPACECIP, 
在 证 明 这 个 引 理 之 前 ， 我 们 先 证 明 一 个 较 弱 的 结果 ， 用 来 说 明 这 个 新 技术 。 可 满足 性 
的 计数 问题 定义 为 语言 
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# SAT = ((¢,k) | p 是 恰好 有 个 满足 赋值 的 合 取 范式 ) 

+ SATE IP, 

证 明 思 路 ”该 证 明 描述 一 个 协议 ， 按 照 这 个 协议 ， 证 明 者 使 检验 者 相信 : & 确实 是 给 
定 的 合 取 范 式 y 的 满足 赋值 的 个 数 。 在 给 出 这 个 协议 之 前 ， 先 考虑 另 一 个 协议 。 它 具有 一 
般 协 议 的 某 种 风格 ， 但 由 于 需要 指数 时 间 的 检验 者 ， 因 而 是 不 能 令 人 满意 的 。 设 6 有 变量 
i I Tiii 

X FOKiSm, LAB fi 如 下 : MF aise .ai€{0.1}, $ filais sai) 等 于 $ 的 
WER rja GSD 的 满足 赋值 的 个 数 。 常 数 函 数 AO Æ g 的 满足 赋值 的 个 数 。 如 果 
aist sai WE po W fr(al,…,am) 等 于 1; 否则 等 于 0。 显 然 ， 对 每 一 个 im Aas, 
Qi» 有 

Filar see? sas) = fij Cais 5:50) + fit Cai 9 °** a; 51) 

KFHSAT 的 协议 ， 从 阶段 0 开始 到 阶段 m 十 1 结束 。 输 入 是 有 序 对 ($,k&)。 

阶段 0 P 把 fo() FAV. 

V 检查 k= 二 fo()。 如 果 不 相 等 ， 则 VV 拒绝 。 

阶段 1 PP 把 f1(0) MAA) 传送 给 V。 

V 检查 foOO=fAi(Ot+fid), WRAAE, MV 拒绝 。 

阶段 2 PH f2(0,0), f2(0,1), 20,0) 和 f2(1,1) 传送 给 V。 

V 检查 f1(0)=f2(0,0) + f2(0,1) MM fi: (1) = f2(1,0) + fo(1,1). 

如 果 有 一 个 不 相等 ， 则 V 拒绝 。 

阶段 m ”对 于 ai 的 每 一 个 赋值 ，P 把 fm (al,…,am) 传送 给 V。 

V 检查 2” 1! 个 联系 fm-1 与 fm 的 等 式 。 如 果 有 一 个 不 相等 ， 则 V 拒绝 。 

阶段 m 十 1 对 于 a; 的 每 一 个 赋值 ，V 通过 计算 $ 关于 这 个 赋值 的 值 来 检查 fx (ase, 
am) 的 值 是 否 正 确 。 如 果 对 于 所 有 的 赋值 都 正确 ， 则 V 接受; 否则 拒绝 。 协 议 的 描述 
完毕 。 

由 于 检验 者 必须 花 指 数 时 间 读 证 明 者 传送 给 它 的 指数 长 的 信息 ， 该 协议 没有 提供 
# SATE IP 中 的 证 明 。 尽 管 如 此 ， 现 在 我 们 来 检查 它 的 正确 性 ， 因 为 这 可 以 帮助 我 们 理 
解 下 面 的 更 有 效 的 协议 。 

赁 直觉 ， 如 果 证 明 者 能 够 使 检验 者 相信 A 中 字符 串 的 成 员 资格 ， 则 协议 判定 语言 A。 
换 名 话说， 如 果 字 符 串 是 A 的 成 员 ， 则 有 一 个 证 明 者 能 够 使 检验 者 以 大 概率 接受 。 如 果 该 
字符 串 不 是 A 的 成 员 ， 则 没有 证 明 者 一 一 即使 是 不 诚实 的 或 狭 独 的 一 一 能 够 使 检验 者 接受 
的 概率 大 于 一 个 较 小 的 数值 。 用 符号 已 表示 正确 地 执行 协议 的 证 明 者 。 当 输入 在 A 中 时 ， 
它 使 V 以 大 概率 接受 。 用 P 表示 当 输入 不 在 A 中 时 任何 与 检验 者 相互 作用 的 证 明 者 。 把 
P 看 成 一 个 对 手 ， 当 V 应 该 拒绝 时 ，P 好 像 正 在 企图 让 V 接受 。 记 号 P 暗示 这 是 一 个 
“不 诚实 的 ”证 明 者 。 

在 刚刚 描述 的 #SAT 协议 中 ， 检验 者 不 考虑 它 的 随机 输入 。 只 要 选 定 了 证 明 者 ， 它 
的 运行 就 是 完全 确定 的 。 因 而 ， 为 了 证 明 协 议 正 确 ， 我 们 证 明 如 下 两 点 事实 。 首 先 ， 如 果 
FEMA (6.2) P k EWE g 的 满足 赋值 的 个 数 ， 则 有 某 个 证 明 者 P 能 使 V 接受 ; 在 每 一 


阶段 中 ， 给 予 正确 响应 的 证 明 者 都 是 这 么 做 的 。 第 二 ， 如 果 上 不正 确 ， 则 每 一 个 证 明 者 P 


都 会 使 V 拒绝 。 下 面 证 明 第 二 种 情况 。 

WE kR, FE P 给 出 了 准确 的 响应 ， 则 由 于 fo() 是 $ 的 满足 赋值 的 个 数 并 且 
FOR, Aili V 在 阶段 0 就 马上 拒绝 。 为 了 阻止 V 在 阶段 0 拒绝 ，P 必须 违背 协议 传送 
一 个 错误 的 foO E, WEDO. ERAH, PO 是 关于 HO 值 的 一 个 谎言 。 和 现实 生 
活 中 一 样 ， 谎 言 引出 谎言 。 为 了 在 后 面 的 阶段 不 被 截 穿 ， 巨 不 得 不 继续 对 其 他 的 fi 值 说 
谎 。 这 些 谎言 和 一 道 最 终 将 在 阶段 m +1 被 截 穿 ， 在 那里 V 直接 验证 f 的 值 。 


更 精确 地 说 ， 因 为 fo 〇 了 关 fo()，P 在 阶段 1 送出 的 值 1(0) MAC) 中 至 少 有 一 个 
是 不 正确 的 ; SW, V 在 检查 是 否 jfo() 三 万 (0) 十 方 (1) 时 拒绝 。 例 如 fio) 的 值 不 正 


确 ， 记 送出 的 值 为 方 (0) 。 如 此 继续 下 去 ， 可 以 发 现在 每 一 个 阶段 ， 互 一 定 要 送出 某 个 不 
正确 的 值 户 (al stai), 否则 V 就 会 拒绝 。 但 是 ， 当 V 在 阶段 mm 十 1 检查 那个 不 正确 的 值 
falais sam) 时 ， 无论 怎样 它 都 会 拒绝 。 于 是 ， 我 们 得 出 结论 ， 如 果 是 不 正确 的 ， 则 


不 论 P 怎么 做 ，V 都 拒绝 。 因 此 ， 该 协议 是 正确 的 。 
这 个 协议 的 问题 是 信息 的 数目 在 每 个 阶段 加 倍 地 增长 。 加 倍 的 原因 是 检验 者 为 了 确认 
一 个 值 fi(…) 需要 两 个 值 fi+1C…,0) 和 fit1(…,1)。 如 果 能 找到 一 种 方法 ， 使 得 检验 
者 在 确认 一 个 fi 值 时 只 使 用 一 个 fi+1 值 ， 那么 信息 的 数目 就 一 点 也 不 会 增加 。 采 用 下 述 
办 法 能 够 做 到 这 一 点 : 把 函数 f; 的 输入 扩大 到 非 布尔 值 ， 并 且 对 从 一 个 有 限 域 中 随机 选 
取 的 站 确认 一 个 值 Sirra 
证 明 B p ERE 到 zw 的 合 取 范 式 。 采 用 算术 化 〈arithmetization) 技术 ， 把 ¢ 
关联 到 一 个 多 项 式 zl,…,znr)， 力 模仿 风 ， 用 算术 运算 十 和 义 模拟 布尔 运算 A VA. 
如 下 所 示 ， 设 a 和 8B 是 两 个 子 公 式 ， 把 表达 式 
«Bh 替换 成 aß 
Ta 蔡 换 成 1—w 
aV p 替换 成 až B= 1—(U—gQ\d—p 
观察 发 现 ，z 的 变量 的 次 数 都 不 大 ， 这 一 点 在 后 面 是 重要 的 。 运 算 ap 和 a xp ERK 
多 项 式 的 次 数 不 超 过 关于 a 和 8B 的 多 项 式 的 次 数 之 和 。 因 而 ， 任 何 变 量 的 次 数 不 超 过 n， 
XE nE KKE. 
如 果 给 p 的 变量 赋 布 尔 值 ， 则 p 和 在 该 赋值 上 得 到 的 结果 一 样 。 当 变量 取 非 布尔 值 
时 ， 不 能 用 6 对 计算 p 做 出 明显 的 解释 。 然 而 ， 不 管 怎样 ， 在 这 个 证 明 中 要 使 用 这 样 的 赋 
值 来 分 析 %， 这 很 像 在 定理 10. 12 的 证 明 中 用 非 布 尔 赋值 分 析 只 读 一 次 的 分 支 程 序 。 变 量 
在 9 个 元 素 的 有 限 域 三 上 取 值 ， 这 里 qg 不 小 于 2". 
用 p 重新 定义 函数 广 ， 在 证 明 思 路 中 曾 定义 过 它们 。 对 于 ONixm Fil ai. aiEF, & 
fila patya) = >， plas ™sam) 


a 1a E (0,1) 
注意 到 这 个 新 定义 是 原 有 定义 的 推广 ， 当 所 有 a: 取 布 尔 值 时 ， 两 者 一 样 。 于 是 ，fo() 仍 
是 p 的 满足 赋值 的 个 数 。 每 一 个 函数 广 (zl,，…，zi) 可 表示 zl 到 zi 的 多 项 式 。 这 些 多 项 
式 的 次 数 不 超 过 p 的 次 数 。 

下 面 给 出 关于 ##SAT 的 协议 。 一 开始 V RWA k) HEARE 46， 得 到 多 项 式 
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力 。 所 有 的 算术 运算 在 域 二 上 进行 ， 参 与 算术 运算 的 至 多 有 9 个 不 同 的 元 素 。 其 中 ，9 是 大 
于 2" 的 素数 。( 找 到 这 样 一 个 满足 条 件 的 g 需要 一 个 附加 的 步 又。 我 们 暂时 忽略 这 一 点， 
因为 马上 将 要 给 出 的 证 明 是 一 个 更 强 的 结果 ， 即 IP 二 PSPACE， 它 不 需要 这 一 点 。) WUE 
方 括号 内 的 注释 放 在 描述 每 一 个 阶段 的 开始 。 


阶段 0 [PIRŠ foO.] 

P>V: PH foO 传送 给 V。 

VRAR=foO. WRAAE, WV 拒绝 。 

阶段 1 [PH V 相信 : MRA) 是 正确 的 ， 则 fo() 是 正确 的 。] 

P>V: PZ f1(z) 作为 z 的 多 项 式 的 全 部 系数 。 

V 利用 这 些 系数 计算 f1(0) 和 fic). 

V 检查 fo0O)= 二 有 1(0) 十 及 (1) EFRA. EARL, Mi., GCE: 所 有 计算 都 在 


WF EHT.) 


à 


绝 。 


V>P.: V 从 三 中 随机 地 选取 一 个 数 r1， 并 且 把 它 传送 给 P。 

阶段 2 [P 使 V 相信 : WR foor) HIERN. Whi) 是 正确 的 。] 
PV: P 传送 f2(ri,z) 作为 z 的 多 项 式 的 全 部 系数 。 

V 利用 这 些 系数 计算 fz (rr ,0) 和 fet). 

V 检查 f1(《ri)= 二 fz《ri,0) 十 fz (ri,1) 是 否 成 立 。 知 不 成 立 ， 则 拒绝 。 
V>P: 双 从 大 中 随机 地 选取 一 个 元 素 ~z 并 且 把 它 传送 给 P. 


Mai [PV 相信 : WR fi(ri，,…,ri) 是 正确 的 ， 则 fi-i1(n>o»n-1) 是 正确 的 ,1 
P>V:; PP 传送 fi(ri,…,ri-1,z) 作为 z 的 多 项 式 的 全 部 系数 。 

V 使 用 这 些 系数 计算 fi《ri,*…,ri-1,0) 和 firi stt ,ri-1，,1)。 

V RE fine Ti-1) 二 fi《risg* ygTi-i150) 十 fi《ri,…sri-191) BERN. FAR 
则 拒绝 。 

V 一 P: V 从 于 中 随机 地 选取 一 个 数 r;， 并 且 把 它 传 送 给 P。 


阶段 m 十 1 [V 直接 验证 fm (ri,…,rm) 是 正确 的 。] 

V 计算 pb,…,rm) FAH fm Cristom) 比较 。 如 果 两 者 相等 ， 则 V 接受 ; AMI 
协议 的 描述 完毕 。 

下 面 证 明 这 个 协议 识别 # SAT。 首 先 ， 当 上 有 个 满足 赋值 时 ， 如 果 证 明 者 也 按照 协 


Ws, WV 显然 一 定 接受 。 其 次 ， 要 证 明 当 y 的 满足 赋值 的 个 数 不 是 & 时， 没有 证 明 者 
能 够 使 V 接受 的 概率 大 于 一 个 很 小 的 值 。 令 P 是 任意 的 证 明 者 。 


为 了 阻止 V BEE, P 在 阶段 0 必须 为 fo() 传送 一 个 不 正确 的 值 fo()。 因 此 ,在 


阶段 1，V 计算 的 f1(0) MAAC) 中 一 定 有 一 个 是 不 正确 的 ， 从 而 P 传送 的 fiz) 作为 


z 的 多 项 式 系数 一 定 是 错 的 。 把 这 些 系数 表示 的 函数 记 作 万 (z)。 下 面 是 证 明 中 的 关键 
步骤。 


时 ， 


当 立 在 大 中 取 一 个 随机 数 A, TRA (nn) 不 大 可 能 等 于 An). 4 n210 
我 们 可 以 证 明 
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Pr[ fi ri) = filen” 

这 个 概率 的 上 界 来 自 引 理 10.13: 次 数 不 大 于 d 的 一 元 多 项 式 最 多 有 个 根 ， 除 非 它 
恒 等 于 0。 因 此 任何 两 个 次 数 不 大 于 d 的 一 元 多 项 式 最 多 在 d 个 地 方 相等 ， 除 非 它 们 处 处 
相等 。 

回忆 一 下 关于 i 的 多 项 式 的 次 数 不 大 于 n, HAWE PP 传送 的 关于 及 的 多 项 式 的 次 
数 大 于 n， 则 VV 拒绝。 已 经 肯定 这 两 个 多 项 式 不 处 处 相等 。 因 而 根据 引 理 10. 13， 它 们 最 
多 在 n 个 地 方 相等 。 厂 的 大 小 大 于 2"。 正好 使 它们 相等 的 机 会 不 超过 n/2*。 当 n 宇 10 
时 ， MBA KF an. 

再 扼要 地 重 述 一 下 至 此 所 证 明 的 东西 。 如 果 fo() 是 错 的 ， 则 方 的 多 项 式 一 定 是 错 的 ， 
从 而 根据 前 面 的 断言 ， 广 (~ ) 大 概 也 是 错 的 。 如 果 出 现 可 能 性 很 小 的 事件 广 (~: ) 等 于 


Ai), P 在 阶段 1“ 很 走运 ”"， 那 么 它 在 协议 的 剩余 部 分 按照 关于 P 的 指令 执行 ， 能 够 
使 V 接受 (虽然 V 应 该 拒绝 )。 


继续 证 明 。 如 果 广 (ri1〉 是 错 的 , V 在 阶段 2 计算 的 f(ri,0) 和 户 (r ,1) 中 ， 至 少 
有 一 个 是 错 的 ， 因 而 P 传送 的 fz (ri ,zx) 作为 z 的 多 项 式 系数 一 定 是 错 的 。 把 这 些 系 数 表 
示 的 函数 记 作 fz (ri sz). BWI fz (ri,z) 和 fz (ri,z) 的 次 数 不 大 于 n， 从 而 和 前 面 一 样 ， 
它们 在 下 中 随机 数 ro 处 相等 的 概率 小 于 n-?*。 于 是 ， 当 VV 随机 地 选取 rs BY, fo (ri,rz) 
多 半 是 错 的 。 

一 般 来 讲 ， 如 此 进行 可 以 证 明 对 于 每 一 个 1<i<m, MR 

Ta 人 
则 当 n 宇 10 时 ， 对 于 在 大 中 随机 选取 的 x;， 
Pr[ fi Cr my) = Fa) | 

于 是 ， 由 于 对 Fo? 给 出 不 正确 的 值 ， P 大 概要 被 迫 对 fi (PL By Cr) sada a 
fn (ni,…,rm) 给 出 不 正确 的 值 。 磁 巧 可 能 在 某 个 阶段 1， 虽然 fi 和 方 不 同 ， 但 是 V 选取 
的 ~; WEF: Cri po or = Fir rie P 磁 上 这 种 好 运 的 概率 为 阶段 数 m Hn, 不 超 
过 1/n。 如 果 P 一 直 不 走运 ， 它 最 后 要 传送 一 个 不 正确 的 fais rm) 值 。 而 V 在 阶段 
m 十 1 直接 验证 fm 的 这 个 值 ， 这 时 任何 错误 都 将 会 被 发 现 。 因 此 ， 如 果 愉 不 等 于 y 的 满足 
赋值 的 个 数 ， 则 任何 证 明 者 都 不 能 使 检验 者 接受 的 概率 大 于 1/m。 

为 了 完成 定理 的 证 明 ， 还 需 证 明 检 验 者 在 概率 多 项 式 时 间 内 运行 。 根 据 对 它 的 描述 ， 
这 是 显然 的 。 af 

下 面 回 到 引 理 10.29 PSPACECIP 的 证 明 。 类 似 上 述 定 理 10. 30 的 证 明 ， 只 是 在 这 里 
要 使 用 一 个 新 的 思想 ， 用 来 降低 协议 中 出 现 的 多 项 式 的 次 数 。 

证 明 思 路 ” 先 试 一 下 在 上 述 证 明 中 采用 的 思想 ， 从 而 找到 困难 在 什么 地 方 。 为 了 证 明 
PSPACE 中 的 每 一 个 语言 都 在 IP 中 ， 只 需 证 明 PSPACE 完全 语言 TQBF Æ IP P, By 
是 一 个 带 量词 的 布尔 公式 

p= Qiri Qr QnrmL $j 
Et g 是 一 个 合 取 范式 ， 每 一 个 Q; EIRY. BAA 的 定义 和 前 面 一 样 ， 只 是 这 次 要 把 
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量词 考虑 进来 。 对 于 OSi<m 和 a1,…,amE10,1}, $ 
js E QHT Quta plnia] AE 
0, 否则 
KP, glais sai) ETE p Pasai 代入 zi1,…,zx;。 于 是 ，fo() 是 yy 的 真 假 值 。 下 
述 算 术 恒 等 式 成 立 : 
当 Qi = V 时 , fi(ai st sai) = fin Car strt 5a; 50) © fia Cai stt 5a; 51) 
4 Qiu = 3 iffiltra) = fini Cai stt Gi 50) * fin Car st 5a; 51) 
回忆 一 下 定义 过 xy 一 1 一 (1 一 Z)(1 一 y) 。 

i + SAT 协议 的 做 法 ， 把 所 有 fi 扩张 到 一 个 有 限 域 上 ， 并 且 对 量词 使 用 这 些 等 式 ， 
而 不 是 对 加 法 运算 使 用 等 式 。 这 个 想法 的 问题 出 在 算术 化 时 每 一 个 量词 可 能 使 产生 的 多 项 
式 的 次 数 加 倍 ， 从 而 这 些 多 项 式 的 次 数 可 能 指数 地 增长 。 这 样 一 来 ， 证明 者 为 了 摘 述 这 些 
多 项 式 ， 必 须 传 送 指数 多 个 系数 ， 进 而 检验 者 必须 运行 指数 时 间 来 处 理 这 么 多 系数 。 

为 了 保持 多 项 式 的 系数 较 少 ， 引 入 化 简 运 算 R， 它 能 降低 多 项 式 的 次 数 而 不 改变 它们 
对 布尔 输入 的 性 状 。 

证 明 设 y 二 Qzri…QzrmL8」 是 带 量词 的 布尔 公式 ， 其 中 是 一 个 合 取 范式 。 为 了 算 
术 化 y， 引 入 下 述 表 达 式 

/ = Qr1 Rr Qr2 Rx Rx2Qv3 Rr Rr2Rr3°" Qe Rx °" Rem] 
暂且 不 管 Rz; 的 含义 ， 它 只 在 定义 函数 f; NAA. HY 重新 写成 
一 SiylSzyz…Steyk[Lg] 
其 市 每 一 个 SEY 3R} EA vst bs 
对 于 每 一 个 ik， 定 义 函 数 fi WM Fo felti stm) 为 算术 化 $$ 得 到 的 多 项 式 pla, 
Sudo Tks fi fi: 
当 SeH = V 时 HC) = fai l0) © fail™ ,1); 
3 Sai = J We fel? = fir .0) fn ,1)s 
4 Sar = R Ws f:Gsa) = A — a) fer (0) 十 区 六 ke。 

MR SH EVRA, WA 比 fi+1 少 一 个 输入 变量 。 如 果 Si+1 是 R， 则 这 两 个 函数 的 
输入 变量 的 个 数 相 同 。 因 此 ， 一 般 来 讲 ， 函 数 f; 将 不 依赖 于 i 个 变量 。 为 避免 书写 麻烦 ， 
H “e” RẸ al,…,a;， 其 中 j 是 一 个 适当 的 值 。 此 外 ， 重 新 排列 这 些 图 数 的 输入 顺序 ， 
使 得 w+1 是 最 后 一 个 输入 变量 。 

注意 ， 当 输入 是 布尔 值 时 ， 对 多 项 式 作 Re 运算 不 改变 它们 的 值 。 因 此 ，Jfo() 仍 是 y 
的 真 假 值 。 但 是 ， 注 意 到 Rr 运算 产生 的 结果 关于 z BREN. Ey, Æ Rz …Rzi 添加 
在 Qiz; 的 后 面 ， 是 为 了 在 算术 化 Q: 导致 变量 次 数 加 倍 之 前 把 每 一 个 变量 的 次 数 都 减少 为 1。 

现在 已 为 描述 协议 做 好 了 准备 。 本 协议 中 的 所 有 算术 运算 都 在 一 个 元 素 个 数 不 少 于 ns 
的 有 限 域 玉 上 进行 ， 其 中 是 y 的 长 度 。V 自己 能 够 找到 一 个 这 么 大 的 素数 ， 因 而 不 需要 
P 提供 。 

阶段 0 TP 传送 fo( ).] 

P-=V: PÆ fo() 传送 给 V。 

V 验证 foO=1. MR POZI, WV 拒绝 。 


fi Cay 9*** 9;) PE 
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阶段 i [P 使 V 相信 ;如 果 fi Cri oer) 是 正确 的 ， 则 FHL) 是 正确 的 .|] 
P>V:; PP 传送 filri，,…,z) 作为 z 的 多 项 式 的 所 有 系数 。( 这 里 ri1…… 表 示 令 这 些 变量 
等 于 前 面 随机 选取 的 值 ri ,rs ,…。) 
V 使 用 这 些 系数 计算 fiC(ri…,0) 和 fi《ri*…,1)。 
V 检查 下 述 等 式 
Fem * fines) £8, = VY 
fines ri 1 4S; = 


LU 


有 | 


和 
fans.) = A-—nNfraisO+rfitn.1) FS =R 

ADR. M V 拒绝。 

V>P: 了 从 大 中 取 一 个 随机 数 >， 并 且 把 它 传送 给 P. C Si = 尺 时 ， 用 这 个 > 代替 
前 面 的 x。) 

转 到 阶段 i 十 1，P 必须 使 V 相信 fi(ri…,r) 是 正确 的 。 

阶段 Kk 十 1 [V 直接 验证 fi (ri,…,rm) 是 正确 的 。] 

Vit p(ns orm), HHS EMÉ frr ，…,rm》 值 比较 。 如 果 两 者 相等 , 则 VV 
接受 ; 否则 拒绝 。 整 个 协议 的 描述 完毕 。 

这 个 协议 的 正确 性 证 明 类 似 于 #SAT 协议 的 正确 性 证 明 。 显 然 ， 如 果 y 为 真 ， 则 P 
能 够 执行 协议 ， 并 且 V 将 会 接受 。 如 果 y 为 假 ， 则 PP 在 阶段 0 必须 说 谎 ， 传 送 一 个 不 正确 
的 foO 的 值 。 在 阶段 1:， 如 果 V 有 不 正确 的 fi-1《r…) WE, M firi) 和 firl) 


中 一 定 有 一 个 值 不 正确 ， 从 而 关于 f; 的 多 项 式 一 定 不 正确 。 因 此 ， 在 阶段 i;， 如 果 忆 走 
Z, fimer) 正确 的 概率 不 超过 这 个 多 项 式 的 次 数 除 以 有 限 域 天 的 大 小 ， 即 n/nt。 协 
议 进行 O(n?) 个 阶段 ， 故 P 在 某 个 阶段 走运 的 概率 不 超过 1/n。 如 果 P KERKEZ, W 
V 将 在 阶段 & 十 1 拒绝 。 
10.5 ”并行 计算 

并 行 计算 机 (parallel computer) 是 能 够 同时 执行 多 个 操作 的 计算 机 。 用 并 行 计算 机 
求解 某 些 问 题 可 能 会 比 用 顺序 计算 机 (sequential computer) 快 得 多 ， 后 者 每 次 只 能 做 一 
个 操作 。 在 实践 中 ， 两 者 之 间 的 差别 有 点 模糊 不 清 ， 因 为 多 数 真实 的 计算 机 (包括 “ 顺 
序 ” 计 算 机 ) 被 设计 成 在 执行 各 条 指令 时 使 用 某 种 并 行 性 。 我 们 在 这 里 关注 的 是 大 规模 并 
行 性 ， 即 在 一 个 计算 中 有 数量 巨大 〈 比 如 数 百 万 或 更 多 ) 的 处 理 单 元 一 起 积极 参与 工作 。 

本 节 简 洁 地 介绍 并 行 计 算 理 论 ， 描 述 一 个 并 行 计 算 机 的 模型 ， 然 后 利用 这 个 模型 给 出 
几 个 能 够 很 好 并 行 化 的 问题 。 此 外 ， 还 要 讨论 并 行 化 不 适合 某 些 问题 的 可 能 性 。 


10. 5. 1 一 致 布尔 电路 


在 并 行 算法 的 理论 研究 中 ， 用 得 最 多 的 模型 之 一 叫 作 并 行 随机 存 取 机 (Parallel Ran- 
dom Access Machine, PRAM), Æ PRAM 模型 中 ， 理 想 化 的 处 理 器 具有 一 个 简单 的 模仿 
实际 计算 机 的 指令 集 ， 它 们 通过 共享 存储 相互 作用 。 在 这 一 小 节 中 ， 不 可 能 详细 地 描述 
PRAM, 我 们 使 用 在 第 9 章 为 别 的 目的 引入 的 男 一 个 并 行 计算 机 模型 一 一 布尔 电路 。 

作为 并 行 计算 模型 ， 布 尔 电路 有 自己 的 优点 和 缺点 。 从 好 的 方面 讲 ， 这 个 模型 的 描述 
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简单 ， 使 证 明 比 较 容 易 。 电 路 还 明显 地 像 现 实 中 的 硬件 设计 ， 在 这 个 意义 上 模型 是 现实 
的 。 从 不 好 的 方面 讲 ， 由 于 各 个 处 理 器 是 很 弱 的 ， 电 路 不 便于 用 来 “编程 ”~。 此 外 ， 在 布 
尔 电 路 的 定义 中 不 允许 有 回路 ， 而 现实 中 构造 的 电路 可 能 有 这 样 的 回路 。 

在 并 行 计算 机 的 布尔 电路 模型 中 ， 把 每 一 个 门 作为 一 个 独立 的 处 理 器 ， 因 此 把 布尔 电 
路 的 处 理 器 复杂 度 (processor complexity) 定义 为 它 的 规模 。 认 为 每 一 个 处 理 器 在 一 个 单 
位 时 间 内 计算 它 的 函数 ， 因 此 把 布尔 电路 的 并 行 时 间 复 杂 度 (parallel time complexity) 
定义 为 它 的 深度 ， 即 从 一 个 输入 变量 到 输出 门 的 最 长 距离 。 

任何 一 个 具体 的 电路 都 有 固定 的 输入 变量 数 ， 故 像 定 义 9. 22 中 定义 的 那样 ， 我 们 用 
电路 族 判 定语 言 。 必 须 对 电路 族 强 加 一 个 技术 性 要 求 ， 使 它们 对 应 于 PRAM 之 类 的 并 行 
计算 模型 。 在 这 类 模型 中 ， 一 台 机 器 能 够 处 理 各 种 长 度 的 输入 。 这 个 要 求 使 你 能 够 容易 地 
得 到 电路 族 中 的 所 有 成 员 。 这 个 一 致 性 〈uniformity) 要 求 是 合理 的 ， 因 为 只 知道 存在 小 
的 电路 判定 一 个 语言 的 某 些 成 员 并 不 是 很 有 用 ， 这 个 电路 本 身 可 能 很 难 找到 。 因 而 给 出 下 

it (Co ,Cl ,Cs ,…) 是 一 族 电 路 ， 如 果 存 在 对 数 空间 的 转换 器 工 ， 当 工 
的 输入 为 1" 时, 醋 输 出 〈C,)， 则 称 该 电路 族 是 一 致 的 。 

回忆 一 下 ， 定 义 9. 23 分 别 用 最 小 规模 和 最 小 深度 的 电路 族 定义 语言 的 规模 复杂 度 和 
深度 复杂 度 。 为 了 明确 要 实现 一 个 具体 的 并 行 时 间 复 杂 度 需要 多 少 处 理 器 ， 或 者 反 过 来 要 
实现 一 个 具体 的 处 理 右 复杂 度 需 要 多 少 并 行 时 间 ， 我 们 在 这 里 同时 考虑 一 个 电路 族 的 规模 
和 深度 。 如 果 存 在 规模 复杂 度 为 f(n) 和 深度 复杂 度 为 g(n) 的 一 致电 路 族 识 别 某 个 语言 ， 
则 称 这 个 语言 的 规模 - 深度 联合 电路 复杂 度 不 超过 (fl(n),g(n))。 

令 A 是 {0,1} 上 由 所 有 含 奇数 个 1 的 字符 串 组 成 的 语言 。 通 过 计算 奇偶 
函数 可 以 检查 A 的 成 员 资格 。 可 以 用 标准 的 AND、OR Al NOT 运算 实现 两 个 输入 的 奇偶 
门 X@y 二 (XA 一 y)V ("zxAy)。 设 电路 的 输入 为 x1，…,xn。 获 取 奇 偶 函 数 的 电路 的 一 个 
办 法 是 构造 g; 门 ， 这 里 gi 二 x1,8g; 二 Xi@g8i-1(i 二 n)。 这 个 构造 使 用 On) 规模 和 OCn) 
TRIE 。 

例 9. 24 HOM Nace, FET AMR ea TAA OC) 规模 和 O(log n) 
深度 的 电路 。 这 个 构造 有 重大 的 改进 ， 它 使 用 的 并 行 时 间 比 前 者 指数 地 少 。 因 此 ，A 的 规 
模 - 深度 复杂 度 为 (O(n) ,O(log n)). a 

回忆 一 下 ， 可 以 用 电路 计算 输出 字符 串 的 函数 。 考 虑 布尔 矩阵 乘法 函数 。 
输入 是 2m? =n (SAR, KRANA m Xm HK AS {ar} 和 B= 二 (bx)}。 输 出 是 m 个 值 ， 表 
示 m Xm FER C={ce}, HP 

ce = V Cay A ba) 
对 于 每 一 个 1，; 和 &， 这 个 函数 的 电路 有 计算 aj Abe Bleu. Ab, WFR—-TiAle, 
电路 包含 一 棵 计算 Vijg 庆 的 或 门 的 二 元 树 。 每 一 棵 这 样 的 树 有 m—1 个 或 门 和 log m 的 深 
度 。 因 此 ， 这 些 布尔 抢 阵 乘法 电路 的 规模 为 Om) =0n?), REK O(logn)。 a 

w A 二 {a;;) 是 一 个 mXm 布尔 矩阵 ，A 的 传递 闭 包 (transitive closure) 
是 矩阵 

A Vy A2 V eee VV A” 
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其 中 Ai 是 i 个 A 的 和 矩阵 乘积 ，V 是 矩阵 元 素 的 按 位 OR。 传 递 闭 包 运 算 与 PATH 问题 关 
系 密切 ， 因 而 与 NL 类 的 关系 密切 。 设 A 是 有 回 图 CG 的 邻接 矩阵 ，A: 是 顶点 与 G 相同 、 
边 表 示 G 中 存在 长 度 为 i 的 路 径 的 图 的 邻接 和 矩阵。A 的 传递 闭 包 是 图 的 邻接 矩阵， 图 中 的 
边 表示 G 中 存在 一 条 路 径 。 

可 以 用 规模 为 i 和 深度 为 logi 的 二 元 树 表示 A 的 计算 ， 其 中 每 个 顶点 计算 它 下面 的 
两 个 矩阵 的 乘积 。 每 个 顶点 是 一 个 OC(m*) 规模 和 对 数 深度 的 电路 。 因 此 ， 计 算 A” 的 电 
路 的 规模 为 O(n?: )， 深 度 为 O(log?n)。 对 每 一 个 At 构造 一 个 电路 ， 共 要 添加 Onm) = 
On? ) 规 模 和 O Cogn) 深度 。 因 此 ,传递 闭 包 的 规模 - 深度 复杂 度 为 COC”), 
O(log?n)) 。 m 


10.5.2 NC 类 


许多 感 兴趣 的 问题 具有 规模 - 深度 复杂 度 (Ol(m*),O(log*n))， 其 中 有 是 常数 。 可 以 
认为 ， 这 样 的 问题 是 能 够 用 适当 数量 的 处 理 机 高 度 并 行 化 的 。 这 促使 我 们 定义 NCR. 

Fil, + NC 是 能 够 用 多 项 式 规模 和 O 〇 (login) 深度 的 一 致 日 电路 
族 识 别 的 语言 类 。NC 是 所 有 在 某 个 NC 中 的 语言 组 成 的 语言 类 。 用 这 种 电路 族 计 算 的 函 
数 分 别 叫 作 NC! 可 计算 的 和 NC 可 计算 的 虽 。 

下 面 考察 这 些 复杂 类 与 我 们 见 过 的 其 他 语言 类 的 关系 。 首 先 给 出 图 灵机 空间 与 电路 深 
度 之 间 的 联系 。 在 对 数 深 度 内 可 解 的 问题 在 对 数 空间 内 也 是 可 解 的 。 反 过 来 ， 在 对 数 空间 
内 甚至 在 非 确定 型 对 数 空间 内 可 解 的 问题 都 是 在 对 数 平方 深度 内 可 解 的 。 

NCL, 

证 明 我 们 扼要 地 描述 识别 NC 中 的 语言 A 的 对 数 空间 算法 。 对 于 长 度 为 n 的 输入 
w， 算 法 构造 关于 A 的 一 致电 路 族 中 的 第 ”个 电路 ， 然 后 通过 从 输出 门 开 始 的 深度 优先 搜 
索 计算 这 个 电路 的 值 。 (为 了 掌握 搜索 的 进展 ) 只 需 记 录 到 当前 正在 考察 的 门 的 路 径 以 及 
沿 这 条 路 径 所 获得 的 部 分 结果 。 电 路 具有 对 数 深 度 ， 因 此 模拟 只 需要 对 数 空间 。 id 

NLENC? , 

证 明 思 路 ”计算 一 台 NL 机 格局 图 的 传递 闭 包 。 输 出 表示 是 否 存 在 从 起 始 格 局 到 接受 
格局 的 路 径 的 状态 。 

证 明 设 A 是 被 一 台 NL 机 M 识别 的 语言 ， 这 里 A 已 被 编码 到 {0,1} 上 。 要 构造 A 
的 一 致电 路 族 (Co ,C1,…)。 为 了 得 到 C,; ， 要 构造 一 个 图 G， 它 很 像 M 对 长 度 为 n 的 输入 
w 的 计算 图 。 在 构造 电路 时 ， 我 们 不 知道 输入 w， 只 知道 w 的 长 度 n。 电 路 的 输入 是 变量 
wi 到 ww， 每 一 个 wi 对 应 输入 中 的 一 个 位 置 。 

回忆 一 下 ，M 关于 w 的 格局 描述 了 M 的 状态 、 工 作 带 的 内 容 以 及 输入 头 和 工作 读 写 
头 的 位 置 ， 但 不 包括 w 本 身 。 因 此 ，M 关于 w 的 格局 集合 实际 上 不 依赖 于 w， 而 仅 与 w 
的 长 度 n 有 关 。 这 些 多 项 式 个 格局 构成 G 的 顶点 集 。 

在 G 的 边 上 标记 输入 变量 wj。 设 cl Ne 是 G 的 两 个 顶点 ，cl 指明 输入 头 的 位 置 是 


O 对 NC 来 说 ， 用 对 数 空间 转换 器 定义 一 致 性 是 标准 的 (i 三 2 时 )， 但 对 于 NC 来 讲 ， 它 给 出 一 种 不 标准 的 
结果 (NC! 包含 子 集 标 准 化 类 NC!) 。 尽 管 如 此 ， 我 们 还 是 给 出 该 定义 ， 因 为 它 更 简单 ， 而 且 能 满足 我 们 的 
© Steven Cook 用 “Nick 类 ”来 命名 NC, AW Nick Pippenger 是 最 早 认 识 到 NC 重要 性 的 人 。 
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i。 当 输入 头 在 读 1 (或 0) 时 ， 按 照 M 的 转移 函数 ，cl 能 够 一 步 产 生 cx ， 则 给 G 中 的 边 
(cisco) 标记 wi (或 w?) 。 如 果 不 管 输入 头 在 读 什么 ，cl 都 能 够 一 步 产 生 cz ， 则 不 给 G 中 
的 这 条 边 作 标记 。 

如 果 根 据 长 度 为 n 的 字符 串 w 安置 好 G 的 边 ， 则 存在 从 起 始 格 局 到 接受 格局 的 路 径 
当 且 仅 当 M 接受 w。 因 此 ， 构 造 一 个 电路 计算 G 的 传递 闭 包 ， 并 且 输 出 表示 是 否 存 在 这 
种 路 径 的 状态 ， 它 恰好 接受 A 中 长 度 为 n 的 字符 串 。 这 个 电路 具有 和 多项式 的 规模 和 
O(log:n) RE. 

使 用 一 台 对 数 空间 转换 器 ， 能 够 对 输入 1" 构造 G 和 C，,。 请 参见 定理 8. 20 中 关于 一 
个 类 似 的 对 数 空 间 转 换 虎 的 详细 描述 。 

多 项 式 时 间 可 解 的 问题 类 包括 NC 中 的 所 有 问题 。 下 述 定理 氢 述 这 一 关系 。 

Gs: NCEP. 

证 明 能 够 用 一 个 多 项 式 时 间 算 法 运行 对 数 空间 转换 器 ， 生 成 电路 C,， 然 后 模拟 Cn 
对 长 度 为 ”的 输入 的 计算 。 a 


10.5.3 P 完全 性 


现在 考虑 了 P 中 所 有 问题 也 在 NC 中 的 可 能 性 。 如 果 这 两 个 语言 类 相等 ， 那 是 完全 出 人 
意料 的 ， 因 为 这 意味 着 所 有 多 项 式 时 间 可 解 的 问题 都 能 够 高 度 并 行 化 。 下 面 介 绍 P 完全 
HE, CEET P 中 某 些 问题 是 固有 可 串 行 化 的 理论 根据 。 

如 果 

1. BEP, 

2. P 中 每 一 个 A 对 数 空间 可 归 约 到 B， 

则 称 语言 B 是 P 完全 的 。 

下 述 定理 仿效 定理 8. 18， 并 且 由 于 NC 电路 族 能 够 计算 对 数 空间 归 约 ， 故 可 以 类 似 地 
证 明 它 。 我 们 把 它 的 证 明 留 作 练习 10. 3。 

GERI 如 有 呆 AL.B 有 B 在 NC 中 , 则 A 在 NC 中 。 

我 们 证 明 电 路 计算 问题 是 P 完全 的 。 对 于 电路 C 和 输入 zx, WC) 为 C 关 于 zZ 的 
值 。 令 CIRCUIT-VALUE=({(C,x)|C 是 布尔 电路 且 C(x)=1)。 

GEME CIRCUIT-VALUE 是 P 完全 的 。 

证 明 定理 9.25 中 给 出 的 构造 说 明了 如 何 把 P 中 任意 的 语言 A 归 约 到 CIRCUIT- 
VALUE 。 对 于 输入 w， 归 约 生 成 一 个 模拟 A 的 多 项 式 时 间 图 灵机 的 电路 。 该 电路 的 输入 
是 w 本身 。 由 于 生成 的 电路 具有 简单 和 重复 的 结构 ， 归 约 能 够 在 对 数 空间 内 实现 。 8 


10.6 密码 学 


在 通信 和 领域 中 使 用 密码 的 加 密 技 术 可 追溯 到 几 千 年 前 。 在 古 罗马 时 期 ， 儒 略 ， 人 已 撤 把 
给 他 的 将 军 们 的 命令 译 成 密码 ， 以 防止 被 敌人 截取 。 在 第 二 次 世界 大 战 中 ， 图 灵机 的 发 明 
AmE + 图 灵 领 导 一 个 英国 数学 家 小 组 破译 德国 人 的 密码 ， 德 国人 用 这 些 密码 给 正在 大 西 
洋 上 巡逻 的 潜艇 发 送 命令 。 现 在 各 国政 府 十 分 重视 密码 技术 ， 投 入 很 大 的 力量 研究 很 难 破 
译 的 密码 和 寻找 别人 使 用 的 密码 的 弱点 。 如 今 ， 公 司 和 个 人 也 使 用 加 密 增 加 信息 的 安全 。 
不 久 的 将 来 ， 几 乎 所 有 的 电子 通信 将 会 受到 密码 保护 。 
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近年 来 ， 计 算 复 杂 性 理论 给 密码 设计 带 来 一 场 章 命 。 人 们 都 知道 ， 密 码 学 人 研究 的 领域 
目前 超出 了 传统 的 通信 和 范围， 而 要 面 对 众 多 涉及 信息 安全 的 问题 。 例 如 ， 现 在 有 一 种 技 
术 ， 经 过 数字 “签名 ”后 的 报 文 可 以 鉴定 发 送 人 的 喘 份 ; 可 以 进行 电子 选举 ， 选 民 在 网 上 
投票 和 公开 统计 选举 结果 ， 不 会 泄露 任何 人 的 投票 情况 ， 能 防止 重复 投票 和 其 他 违法 行 
为 ; 构造 不 要 求 通 信 双 方 预先 约定 加 密 和 解密 算法 的 新 型 密码 。 

密码 学 是 复杂 性 理论 的 重要 实践 领域 。 数 字 蜂 人 帘 电话 、 卫 星 电视 直播 以 及 网 上 电子 商 
务 等 全 都 依赖 加 密 措施 保护 信息 。 这 些 系统 已 进入 大 多 数 人 的 日 党 生活。 密码 学 已 经 促进 
了 复杂 性 理论 和 其 他 数学 领域 内 的 许多 研究 。 


10.6.1 密 钥 


在 传统 解密 技术 中 ， 当 发 信人 打算 给 报 文 加 密 ， 使 得 只 有 某 个 接收 人 能 够 对 它 解密 
时 ， 发 信人 和 收 信人 共有 一 个 密 钥 (secret key) 。 密 钥 是 加 密 算法 和 解密 算法 使 用 的 一 自 
信息 。 因 为 任何 得 到 密 钥 的 人 都 能 够 加 密 和 解密 报 文 ， 故 保守 密 钥 的 秘密 对 密码 的 安全 是 
至 关 重 要 的 。 

如 果 密 钥 太 短 ， 可 以 通过 蛮 力 搜索 整个 密 钥 空间 发 现 它 。 甚 至 长 一 些 的 密 钥 也 可 能 容 
易 受 到 某 些 攻击 一 一 等 会 儿 还 要 谈 这 个 问题 。 使 密码 绝对 安全 的 唯一 办 法 是 使 用 与 发 送 的 
全 部 报 文 一 样 长 的 密 钥 。 

与 报 文 一 样 长 的 密 钥 叫 作 一 次 性 衬 垫 (one-time pad)。 本 质 上 ， 一 次 性 衬 垫 密 钥 的 每 
一 位 只 使 用 一 次 ， 用 来 加 密 报 文 的 一 位 ， 以 后 不 再 使 用 密 钥 的 这 一 位 。 一 次 性 衬 垫 的 主要 
问题 是 ， 如 果 通 信 量 很 大 则 密 钥 可 能 相当 大 。 因 此 ， 就 大 多 数 的 目的 而 言 ， 一 次 性 衬 垫 由 
于 非常 不 便 通常 被 认为 是 不 实际 的 。 

使 用 中 等 长 度 的 密 钥 ， 可 以 进行 不 限量 安全 通信 的 密码 是 更 可 取 的 。 有 趣 的 是 ， 理 论 
上 不 可 能 有 这 样 的 密码 ， 但 矛盾 的 是 ， 在 实践 中 却 使 用 着 它们 。 在 理论 上 不 可 能 有 这 种 类 
型 的 密码 ， 是 因为 能 够 对 可 能 的 密 钥 空间 进行 蛮 力 搜索 ， 找 到 比 报 文 短 很 多 的 密 钥 。 因 
此 ， 以 这 种 密 钥 为 基础 的 密码 在 原则 上 是 可 破译 的 。 对 这 种 自 相 矛 盾 的 怪事 有 一 种 解释 。 
因为 当 密 钥 有 中 等 长 度 时 ， 比 如 100 位 ， 蛮 力 搜索 太 慢 ， 所 以 密码 在 实践 中 无 论 如何 是 能 
够 保证 足够 的 安全 的 。 当 然 ， 如 果 密 码 能 用 其 他 的 快速 方式 破译 ， 那 么 它 也 是 不 安全 和 不 
应 该 使 用 的 。 最 重要 的 是 ， 要 确认 密码 不 可 能 被 快速 破译 。 

现在 还 没有 办 法 保证 使 用 中 等 长 度 密 钥 的 密码 实际 上 是 安全 的 。 为 保证 密码 不 能 被 快 
速 破译 ， 至 少 需 要 在 数学 上 证 明 不 能 快速 地 找到 密 钥 。 然而， 这样 的 证 明 似乎 超出 当代 数 
学 的 发 展 水 平 ! 理由 如 下 ， 一 旦 发 现 密 钥 ， 验 证 它 的 正确 性 是 容易 做 到 的 ， 只 需 检查 用 它 
解密 后 的 报 文 。 因 此 ， 密 钥 验 证 问题 可 以 公式 化 为 P 中 的 一 个 问题 。 如 果 能 够 证 明 不 能 在 
多 项 式 时 间 内 找到 密 钥 ， 就 证 明了 P 不 等 于 NP， 从 而 取得 重大 的 数学 进展 。 

由 于 不 能 从 数学 上 证 明 密码 是 不 可 破译 的 ， 因 此 改 成 依靠 实践 证 据 。 在 过 去 ， 密 码 的 
质量 靠 雇用 专家 来 评价 。 请 他 们 破译 密码 ， 如 果 他 们 不 能 破译 ， 就 会 增加 对 密码 安全 性 的 
可 信和 度 。 这 种 方法 有 明显 的 不 足 。 如 果 别 人 有 比 我 们 更 好 的 专家 ， 或 者 我 们 对 自己 的 专家 
缺乏 信任 ， 那 么 密码 的 完整 性 可 能 受到 损害 。 尽 管 如 此 ， 直 到 最 近 这 还 是 唯一 可 供 使 用 的 
方法 ， 像 美国 国家 标准 与 技术 局 正式 批准 的 数据 加 密 标 准 (DES) 这 样 一 些 广泛 使 用 的 密 
码 的 可 靠 性 也 有 赖 于 它 。 

计算 复杂 性 理论 提供 了 另 一 种 获得 密码 安全 性 证 据 的 方法 。 我 们 可 以 给 出 破译 这 个 密 
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码 的 复杂 度 与 男 外 某 个 问题 的 复杂 度 之 间 的 联系 ， 而 后 者 已 经 有 使 人 相信 的 难 解 性 证 据 。 
回忆 一 下 ， 我 们 已 经 用 NP 完全 性 作为 某 些 问题 难 解 的 证 据 。 把 一 个 NP 完全 问题 归 约 到 
密码 破译 问题 ， 可 以 证 明 这 个 密码 破译 问题 本 身 是 NP 完全 的 。 但是， 这 没有 提供 安全 的 
充分 证 据 ， 因 为 NP 完全 性 涉及 最 坏 情 况 的 复杂 性 。 一 个 问题 虽然 是 NP 完全 的 ， 但 是 有 
可 能 在 大 多 数 时候 它 是 容易 解 的 。 密 码 则 必须 总 是 很 难 破译 的 ， 因 而 需要 考虑 平均 复杂 
度 ， 而 不 是 最 坏 情况 的 复杂 度 。 

整数 因子 分 解 问题 是 公认 的 在 平均 情况 下 非常 难 解 的 问题 。 几 个 世纪 以 来 ， 一些 顶尖 
数学 家 一 直 对 因子 分 解 感 兴趣 ， 但 是 还 没有 人 发 现 它 的 快速 算法 。 围 绕 因 子 分 解 问题 已 经 
建立 了 某 些 现代 密码 ， 破 译 这 种 密码 对 应 因子 分 解 一 个 数 ， 这 就 构成 这 些 密 码 是 安全 的 、 
令 人 信服 的 证 据 。 因 为 破译 这 种 密码 的 有 效 方法 能 够 导出 快速 的 因子 分 解 算法 ， 这 可 是 计 
算数 论 中 的 重大 进展 ! 


10.6.2 ABBAS 


在 传统 的 密码 学 中 ， 甚 至 当 密 钥 适 当地 短 时 ， 密 码 的 管理 仍 是 普遍 使 用 密码 的 一 个 障 
碍 。 一 个 问题 是 每 一 对 希望 进行 专门 通信 的 双方 需要 为 此 建立 一 个 联合 密 钥 。 男 一 个 问题 
是 每 一 个 人 需要 保存 一 个 秘密 的 数据 库存 放 所 有 这 样 建 立 起 来 的 密 钥 。 

新 近 开 发 的 公 钥 密码 很 好 地 解决 了 这 两 个 问题 。 在 传统 的 私 钥 密码 系统 (private- key 
cryptosystem) 中 ， 加 密 和 解密 使 用 相同 的 密 钥 。 与 此 不 同 ， 在 公 钥 密码 系统 (public-key 
cryptosystem) 中 ， 解 密 密 钥 不 同 于 加 密 密 铀 ， 并 且 不 容易 从 加 密 密 钥 中 计算 出 来 。 

虽然 可 能 有 人 认为 这 是 一 个 简单 想法 ， 但 是 将 两 种 密 钥 分 开 产 生 了 意义 深远 的 结果 。 
现在 每 一 个 人 只 需要 建立 一 对 密 钥 : 一 个 加 密 密 钥 和 一 个 解密 密 钥 D。 各 人 保守 自己 的 
D 的 秘密 而 公开 上。 如果 乙 想 给 甲 发 一 条 报 文 ， 乙 要 在 公共 的 密 钥 簿 上 找到 甲 的 EE， 用 
它 加 密 报 文 ， 然 后 发 送 给 甲 。 甲 是 唯一 知道 自己 的 DD 的 人 ， 所 以 只 有 他 能 够 解密 这 段 
报 文 。 

某 些 公 和 钥 密 码 系统 还 可 以 用 于 数字 签名 (digital signature)。 如 果 一 个 人 在 发 送 报 文 
之 前 对 它 运 用 他 的 保密 的 解密 算法 ， 则 任何 人 能 够 运用 他 的 公开 的 加 密 算法 验证 报 文 确实 
是 他 发 的 。 于 是 ， 他 有 效 地 “签署 ”了 那 段 报 文 。 这 种 应 用 要 求 可 以 以 任何 顺序 运用 加 密 
算法 和 解密 算法 ，RSA 密码 系统 就 是 这 样 的 。 


10. 6.3 单 向 函数 


单 向 函数 和 天 窗 函 数 是 现代 密码 学 理论 的 基础 。 用 复杂 性 理论 作为 密码 学 基础 的 一 个 
优点 是 ， 它 有 助 于 在 我 们 辩论 安全 性 时 提供 一 个 共同 的 假设 平台 。 在 存在 单 回 函数 的 假设 
下 ， 能 够 构造 出 安全 的 私 钥 密码 系统 。 在 存在 天 窗 函 数 的 假设 下 ， 能 够 构造 出 公 钥 密码 系 
统 。 这 两 个 假设 还 有 一 些 其 他 的 理论 和 应 用 的 结果 。 在 做 一 些 准备 后 我 们 将 定义 这 两 种 
PR 2 

如 果 对 每 一 个 w, wA fw) WKS. WW oem f:D* 一 3* 是 保 长 的 〈length- 
preserving). WRRK AAA SILAS A lel FF BR BR — EB, BI x 关 y 时 ， 
f(z) 关 f(y)， 则 称 它 是 一 个 置换 (permutation), 

回忆 一 下 10. 2 节 给 出 的 概率 图 灵机 的 定义 。 假 定 概率 图 灵机 M 计算 概率 函数 M:5* 一 
5* ， 这 里 对 每 一 个 输入 w 和 输出 过， 令 
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Pri M(w) = =] 
为 M 从 输入 w 开始 停机 在 接受 状态 且 停机 时 带 的 内 容 为 z 的 概率 。 注 意 ，M 对 输入 w 有 
时 可 能 不 接受 ， 故 
2 Pri M(w) =z] 1 
rez 

下 面 定 义 单 回 函 数 。 粗 略 地 说 ， 一 个 函数 是 单身 的 是 指 它 是 单身 容易 计算 的 ， 但 反 过 
来 几乎 总 是 困难 的 。 在 下 面 的 定义 中 ，f 表示 容易 计算 的 单 向 函数 ，M 表示 企图 反 演 了 的 
多 项 式 时 间 概 率 算法 。 单 向 置换 是 一 种 较 简 单 的 单 向 函数 。 因 此 下 面 先 定义 单 向 置换 ， 再 
定义 单 回 函数 。 

单 向 置换 (one-way permutation) 是 具有 下 述 两 条 性 质 的 置换 f: 

l. 三 是 多 项 式 时 间 可 计算 的 。 

2. 对 于 每 一 台 多 项 式 时 间 概 率 图 灵机 M、 每 一 个 有 和 充分 大 的 n， 如 果 取 长 度 为 n 的 
Ep E w 并 且 对 输入 fl(w) 运行 M， 则 

Prm, o MCC) = wl 
这 里 Prw,w 表 示 概 率 是 在 M 所 做 的 随机 选择 和 ww 的 随机 选取 上 取 到 的 。 

单 向 函数 (one- way function) 是 具有 下 述 两 条 性 质 的 保 长 函数 f: 

1. 了 是 多 项 式 时 间 可 计算 的 。 

2. 对 于 每 一 台 多 项 式 时 间 概 率 图 灵机 M、 每 一 个 有 和 充分 大 的 n， 如 果 取 长 度 为 n 的 
随机 串 忆 并且 对 输入 fl(w) 运行 M， 则 

Pru,wlLM(f(w)) = ys 其 中 f(y) = flwl<n* 

对 于 单 向 置换 ,任何 多 项 式 时 间 概 率 算法 只 能 以 很 小 的 概率 反 演 f/， 即 不 大 可 能 从 
fl(w) 计 算出 w。 对 于 单 向 函数 ,任何 多 项 式 时 间 概 率 算法 不 大 可 能 找到 一 个 映射 到 f(w) 
的 y。 

乘法 函数 mule 可 能 是 一 个 单 向 函数 。 设 3= {0,1} 。 对 于 任意 的 wE3* ， 
令 mult(w) 是 表示 w 的 前 一 半 与 后 一 半 乘 积 的 字符 串 。 形 式 地 表示 为 : 

mult (w) = w 。 we 
其 中 w 二 wiws ， 且 当 |w| 为 偶数 时 ，|wi | 二 |wz|; 当 |w| 为 奇数 时 ，| w| =|| tl w 
和 we 作为 二 进 制 数 处 理 。 在 mult(w) 的 前 面 添 加 0 使 得 它 与 w 一 样 长 。 尽 管 人 们 对 整 
数 因子 分 解 问题 做 了 大 量 研 究 ， 但 还 不 知道 有 多 项 式 时 间 概 率 算法 能 够 反 演 mult， 即 使 对 
于 输入 的 多 项 式 分 之 一 也 不 知道 这 样 的 算法 。 a 

如 果 假 设 存 在 单 癌 函数 ， 则 可 以 构造 出 安全 性 可 证 明 的 私 钥 密码 系统 。 在 这 里 给 出 这 
个 构造 太 复 杂 了 。 作 为 一 种 蔡 代 ， 我 们 说 明 如 何 使 用 单身 函数 实现 密码 的 另 一 种 应 用 。 

安全 性 可 证 明 的 口令 系统 是 单 向 函数 的 一 个 简单 应 用 。 在 典型 的 口令 系统 中 ， 用 户 必 
须 键 人 一 个 口令 才能 访问 某 个 资源 。 系 统 用 加 密 方式 保存 用 户口 令 数 据 库 。 给 口令 加 密 是 
为 了 当 数 据 库 偶然 地 或 故意 地 不 加 保护 时 保护 它们 。 口 令 数据 库 经 常 是 不 加 保护 的 ， 使 得 
各 种 应 用 程序 能 够 读 它 们 和 验证 口令 。 当 用 户 键 入 一 条 口令 后 ， 系 统 先 对 它 加 密 ， 然 后 判 
断 它 是 否 与 数据 库 中 存储 的 形式 相 匹 配 ， 这 样 就 能 验证 它 的 有 效 性 。 显 然 ， 我 们 希望 加 密 
方案 是 很 难 反 演 的 ， 使 得 很 难 从 口令 的 加 密 形 式 得 到 不 加 密 的 口令 。 人 们 自然 会 选择 单 向 
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10.6.4 RAAH 


我 们 不 知道 如 果 存 在 单 向 函数 ， 是 否 一 定 能 够 构造 公 钥 密码 系统 。 为 了 得 到 这 样 的 系 
统 ， 要 使 用 天 窗 函 数 ， 对 于 专门 的 信息 它 能 够 有 效 地 反 演 。 

首先 ， 需 要 讨论 给 函数 族 做 索引 的 函数 。 设 有 函数 族 {f;}， 其 中 i€53*， 可 以 用 一 
个 函数 f ;2" XI >I 表示 它们 ， 这 里 对 于 每 一 个 2 和 waio) 一 广 ( 中 7 。 称 了 是 一 个 
索引 函数 。 如 果 每 一 个 被 索引 函数 f; 是 保 长 的 ， 则 说 f 是 保 长 的 。 

天 窗 函 数 (trapdoor function) 是 带 有 一 台 辅 助 的 多 项 式 时 间 概 率 图 灵 
机 G 和 一 个 辅助 函数 用:5* XE 一 5* 的 保 长 索引 函数 f:5* XE 一 53* 。 三 件 套 f、G 和 
h 满足 下 述 3 个 条 件 : 

l BH fFhASRANRATHHH. 

2. 对 于 每 一 个 多 项 式 时 间 概 率 图 灵机 万 、 每 一 个 kk 和 充分 大 的 n， 如 果 取 G 对 1" FH 
随机 输出 (i,t) 和 随机 串 wed”, A 

Pre,wlLEG; fi(w)) yy 其 审 LO) = filw))] <n 

3. 对 于 每 一 个 n、 每 一 个 长 度 为 nn 的 w 和 G 对 任 一 输入 以 非 零 概率 输出 的 每 一 个 (i,1)， 
有 h(t,fi(w)) 二 y， 这 里 fi(y) 二 fi(w)。 

概率 图 灵机 G 生成 索引 族 中 一 个 函数 的 索引 ， 同 时 生成 一 个 值 :， 它 使 fi 成 为 能 快速 
反 演 的 函数 。 条 件 2 说 当 缺 少 上 时 f; 是 难 反 演 的 。 条件 3 说 当 已 知 上 时 Si 是 容易 反 演 的 。 

这 里 描述 一 个 天 窗 函 数 ， 它 为 众所周知 的 RSA 密码 系统 奠定 了 基础 。 给 
出 它 的 联合 三 件 套 f+、G 和 有 h。 生 成 机 器 G 按 如 下 方式 运作 。 在 输入 1” 上 ， 它 随机 地 选取 
两 个 大 小 为 的 数 ， 测 试 它们 是 否 为 素数 。 如 果 它 们 不 是 素数 ， 则 重新 选取 ， 直 到 成 功 地 
选取 两 个 素数 ， 或 者 达到 预先 规定 的 暂 定 界限 ， 并 且 宣 布 失 效 。 找 到 p 和 9g 以 后 ， 它 计算 
N= 二 pg 和 $n) 二 (p 一 1)(g 一 1)。 选 取 1~$(n) 之 间 的 一 个 随机 数 e， 检 查 e ERS gl) 
互 素 。 如 果 不 是 ， 则 另 取 一 个 数 并 且 重 复 检查 。 然 后 ， 计 算 e。 模 8(n) WHEW Id. X 
是 可 以 做 到 的 。 因 为 {1,…,$(n)) 中 与 $(n) 互 素 的 数 在 模 4(n) 乘法 运算 下 构成 一 个 
群 。 最 后 ，G 输出 ((N,e).d). BA 了 的 索引 由 两 个 数 N Me 组 成 。 令 

re) 一 mod N 
KH Ah A 
h(d,x) = x4 mod N 

AA hd, fn.e(w)) =w mod N=w, WAA A IEP Rif. = 

A ERRAK, WER RSA 天 窗 函 数 ， 构 造 公 钥 密 码 系 统 如 下 。 公 开 的 密 钥 是 
概率 图 灵机 G 产生 的 索引 i。 保 密 的 密 钥 是 对 应 的 值 :。 加 密 算 法 把 报 文 m 分 成 若干 大 小 
不 超过 log N 的 块 。 对 于 每 一 块 w， 发 送 人 计算 f;。 所 得 到 的 字符 串 序列 将 是 加 密 的 报 
文 。 接 收 人 用 函数 刀 从 加 密 的 报 文 获得 原始 报 文 。 


练习 


10.1 证 明 : 深度 为 O(log n) 的 电路 族 是 多 项 式 规模 的 电路 族 。 

10.2 证 明 : 12 不 能 通过 费 马 测试 ， 从 而 不 是 伪 素 数 。 

10.3 证 明 : 如 果 A<LB 有 目 B 在 NC 中 ,， 则 A 也 在 NC 中 。 

10.4 证 明 : 有 个 输入 的 奇偶 函数 能 用 OCn) 个 顶点 的 分 支 程序 计算 。 
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10.5 WH: 有 7 个 输入 的 多 数 函 数 能 用 OCm) 个 顶点 的 分 支 程 序 计算 。 
10.6 WEH: 任何 有 个 输入 的 函数 都 能 用 OC(2") 个 顶点 的 分 支 程序 计算 。 
A10.7 EAA: BPPCPSPACE, 
问题 
10.8 如果 BPL 是 概率 对 数 空间 图 灵机 以 错误 概率 二 判定 的 语言 集合 ， 证 明 BPLSP。 
10.9 如果 EQpp={(B,,Bz2>|Bi 和 Bo 是 两 个 等 价 的 分 支 程序 ) 证明 : EQpp dt coNP 完全 的 。 
10.10 假定 ZPP- 机 器 M 是 一 台 概 率 图 灵机 。 它 的 每 个 分 支 有 三 种 输出 : 接受 、 拒 绝 和 ?。 如 果 M 对 
每 个 输入 串 w 都 输出 正确 答案 UR wE A MBL, MR wEA 则 拒绝 ) 的 概率 大 于 等 于 2/3 
而 且 M 从 不 回答 错误 ， 则 M 判定 语言 A。 对 每 个 输入 ，M 输出 “?” 的 概率 至 多 为 /3。 更 进 
一 步 ， 对 输入 w，M 所 有 分 支 上 的 平均 运行 时 间 一 定 限定 在 输入 串 w 长 度 的 多 项 式 时 间 。 令 
ZPP 是 ZPP- 机 器 识别 语言 的 集合 。 证 明 RPAN coRP=ZPP, 
10.11 WH: 如 果 NPCBPP， 则 NP=RP。 
10.12 证 明 : 如 果 A 是 一 个 正则 语言 ， 则 存在 分 支 程序 族 (Bi ,Bz ,…)， 使 得 每 一 个 B 恰好 接受 A 
中 长 度 为 n 的 所 有 字符 串 ， 且 规模 不 超过 ?的 常数 倍 。 
10.13 证 明 : 如 果 A 是 工 中 的 一 个 语言 ， 则 存在 分 支 程序 族 (Bi ,Bs,…)， 使 得 每 一 个 B, 恰好 接受 
A 中 长 度 为 n 的 所 有 字符 串 ， 且 规模 不 超过 nn 的 多 项 式 。 
A*10.14 H: 对 于 任意 的 整数 pol, MR p 不 是 伪 素 数 ， 则 p 至 少 对 Z。 中 的 一 半 的 数 不 能 通过 费 
马 测 试 。 
10.15 回忆 一 下 ，NPsAI 是 以 可 满足 性 问题 作 论 示 的 非 确 定型 多 项 式 时 间 图 灵机 识别 的 语言 类 。 证 
HA: NP“?T=>3,P. 
10.16 证 明 费 马 小 定理 ， 即 定理 10.6。( 提 示 : 考虑 序列 al ,a?,…。 一定 发 生 什么 ?” 如何 发 生 ?) 
10.17 WEAR: 如 果 PH 二 PSPACE， 则 多 项 式 时 间 层 次 只 有 有 限 个 不 同 的 层次 。 
10.18 WH: wW P=NP, Wj) P=PH. 
10.19 设 M 是 一 台 多 项 式 时 间 概 率 图 灵机 ， 语 言 C 满足 下 述 条 件 : 对 于 某 个 固定 的 0<e1<e2<1, 
a. wE C 蕴涵 PrLM 接受 wj <e. 
b. wE C 蕴涵 PrLM ÈZ w] Sez. 
证 明 : CE BPP. (42%: 利用 引 理 10.5.) 
10.20 $ CNF =i p) p 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包含 任意 多 个 文字 ， 但 最 多 只 有 
一 个 非 的 文字 }。 问 题 7. 52 要 求证 明 CNFHEP。 请 给 出 从 CIRCUIT- VALUE 到 CNFH 的 对 
数 空间 归 约 ， 从 而 得 到 CNEFH 是 P- 完全 的 结论 。 
* 10.21 k 头 下 推 自动 机 (上 PDA) 是 具有 个 双 回 只 读 输 入 头 和 一 个 读 写 栈 的 确定 型 下 推 自动 机 。 征 
义 语言 类 
PDA, = {A | A #®— £ k- PDA 识别 } 
WEH: P=U,PDA,. (42: 回忆 一 下 ，P 等 于 交错 式 对 数 空间 可 识别 的 语言 类 。) 
* 10. 22 布尔 公式 是 一 个 布尔 电路 ， 其 中 每 一 个 门 只 有 一 条 输出 线 ， 同 一 个 输入 变量 可 以 在 布尔 公式 
的 多 处 出 现 。 证 明 : 一 个 语言 具有 多 项 式 规 模 的 公式 族 当 且 仅 当 它 在 NC! 中 。 这 里 不 考虑 一 
致 性 。 
10.23 设 A 是 {0,1) 上 的 正则 语言 。 证 明 A 的 规模 - 深度 复杂 度 为 〈O(Cz) ,O(log n)). 
习题 选 解 


10.7 如 果 M 是 一 个 运行 于 多 项 式 时 间 的 概率 图 灵机 ， 对 某 个 常数 7 我 们 对 M 进行 修改 ,使 得 它 只 


能 在 每 一 计算 分 支 上 恰好 进行 m 次 抛 硬币 试验 。 于 是 ， 判 定 M 接受 输入 串 的 概率 的 问题 转化 


10. 14 
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为 计算 有 多 少 个 接受 分 支 ， 并 把 计算 结果 与 所 25” 进行 比较 。 这 种 计算 消耗 多 项 式 空 间 。 

如 果 一 个 数 a 对 p 不 能 通过 费 马 测试 ， 即 at '~Al(mod p), MEK a 为 一 个 见证 。 令 Z} 表示 
{1,…,p 一 1) 中 所 有 与 p 互 素 的 数 。 如 果 p 不 是 伪 素 数 ， 它 在 Z; 中 有 一 个 见证 a。 

使 用 a 可 以 得 到 很 多 的 见证 。 对 每 一 个 非 见 证 ， 在 Z 中 找到 一 个 独特 的 见证 。 如 果 dE Zp 
是 一 个 非 见 证 ， 能 够 得 到 dj-_1 三 1(mod p)。 因 此 ， (da mod p)?! Æ1(mod p), Wi, 
da mod p 是 一 个 见证 。 如 果 di Md, HZ; 中 两 个 不 同 的 非 见 证 ， 则 dia mod p#dza mod p, 
Fj, (dı —d2)a=0(mod p)， 故 而 对 有 些 整 数 c,(di 一 ds)a 二 cp。 但 是 因为 di M d: Æ Z 
中 ， 所 以 (di 一 ds) 二 p， 因 此 a 二 cp/(di 一 d;) 且 pp 有 大 于 1 的 公 因 子 。 这 导出 了 矛盾 ， 因 为 
a 和 p 是 互 素 数 。 因 此 ，Zy 中 的 见证 个 数 一 定 和 ZS 中 的 非 见 证 个 数 一 样 多 ， 故 而 至 少 ZS 
中 一 半 的 成 员 是 见证 。 

下 面 证 明 Z%. 中 每 个 不 与 p 互 素 的 成 员 b5 都 是 见证 。 如 果 5 和 pp 有 公 因 子 ， 那 么 ， 对 任意 的 
e>0, AL Mp 都 含有 该 公 因子 。 因 此 ，6b?-! 关 1(mod p). MA, 我们 得 出 结论 ， 至 少 Z 中 
一 半 的 成 员 是 见证 。 
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